AMD prezentuje nowy model językowy OLMo obsługujący miliard parametrów

AMD nie powiedziało jeszcze ostatniego słowa i powoli stara się gonić gigantów na rynku AI. Chociaż firma głównie konkuruje z Intelem w zakresie produkcji specjalistycznych procesorów do trenowania modeli językowych, ostatni sukces AMD polega na opracowaniu własnego modelu. I to nie byle jakiego, bo AMD OLMo obsługuje ponad 1 miliard parametrów, a dane treningowe obejmowały 1,3 biliona tokenów. Liczy imponują, ale w kontekście rosnącej przewagi rynkowej Intel pojawiają się pytania o możliwą fuzję. Sprawdzamy, jak działa i do czego służy najnowszy model językowy AMD OLMo oraz jakie mogą być dalsze konsekwencje dla AMD! Rozwój AMD OLMo może być kluczowy dla strategii firmy, zwłaszcza w kontekście rosnącego zapotrzebowania na rozwiązania oparte na sztucznej inteligencji. Należy również zauważyć, że ’ai search jako rzeczywista kategoria’ nabiera znaczenia, ponieważ firmy w coraz większym stopniu polegają na efektywnym przetwarzaniu danych i generowaniu treści. W dłuższej perspektywie sukces AMD w tym obszarze może zadecydować o jej pozycji na rynku technologii AI.

AMD nie wycofuje się z wyścigu AI

AMD nie wycofuje się z rywalizacji na rynku sztucznej inteligencji. Dobitnie świadczy o tym prezentacja najnowszego modelu językowego – AMD OLMo. To pierwszy model językowy giganta, który został opracowany pod CEO, Lisy Su oraz CTO i wiceprezesa, Marka Papermastera. Branża komentuje, że po niespodziewanym sukcesie Nvidii i OpenAI AMD zdołało szybko zebrać szyki i dostosować się do nowych warunków gry, tworząc samodzielnie innowacyjne rozwiązania w zakresie sztucznej inteligencji. Oprogramowanie AMD OLMo obiecuje nie tylko wszechstronność w przetwarzaniu języka naturalnego, ale także może zrewolucjonizować inne dziedziny, takie jak rewolucja w generowaniu muzyki. Nowy model ma potencjał, aby zmienić sposób, w jaki twórcy muzyki i artyści tworzą swoje dzieła, oferując zaawansowane narzędzia do składania utworów i odkrywania nowych brzmień. Wsparcie AMD w obszarze sztucznej inteligencji może przyczynić się do powstania całkiem nowych brzmień i stylów muzycznych.

Chociaż w zakresie GPU wykorzystywanych przez AI prym wiedzie Nvidia, komentatorzy wskazują, że sukces najwyżej wycenianej spółki świata kształtował się przez ostatnie lat. Samą dziedziną sztucznej inteligencji Nvidia zajmowała się już od dawna. W latach, gdy nie było jeszcze w ogóle mowy o AI tak, jak dziś, Nvidia stopniowo poszerzała paletę produktów elitarnych, tworzonych dla firm IT, o specjalistyczne chipsety GPU konstruowane z myślą o przetwarzaniu niezliczonych bazach danych. Opracowanie własnego modelu językowego na pewno zapisze się na kartach historii spółki jako nowy etap, w którym AMD nie tylko dostarcza infrastrukturę techniczną na potrzeby procesu trenowania modeli, ale również opracowuje gotowe rozwiązania.

AMD vs Nvidia: strategia wobec dominującego giganta

Kiedy światło dzienne ujrzał ChatGPT pod koniec 2022 r., wszyscy zastanawiali się, jaki sprzęt wykorzystywany był do tworzenia tak zaawansowanych modułów, które muszą korzystać z olbrzymiej mocy obliczeniowej i które trenowane są na gigantycznych zbiorach danych. Nvidia zaskoczyła rynek, gdy okazało się, że odpowiada praktycznie wyłącznie za chipsety GPU zarówno dla Microsoft Copilot, jak i ChatGPT OpenAI. Na sukces ten Nvidia pracowała dwie dekady. To właśnie dzięki AI obecnie jest spółką giełdową o najwyższym poziomie kapitalizacji rynkowej na świecie. Nvidia nie tylko zrewolucjonizowała rynek technologii obliczeniowej, ale również stała się kluczowym partnerem w innowacjach opartych na sztucznej inteligencji. Współpraca OpenAI z Financial Times jest kolejnym dowodem na rosnące zainteresowanie rozwojem AI w różnych sektorach, co tylko podkreśla znaczenie nowoczesnych rozwiązań informatycznych w biznesie. Dzięki tak strategicznym sojuszom, firmy mają szansę na firnniejsze wykorzystanie potencjału sztucznej inteligencji.

Koncentracja na rynku podzespołów wykorzystywanych do szkolenia modeli językowych jest ogromna. Nvidia zajmuje tu ponad 75% rynku. AMD nie ma szans w bezpośredniej konkurencji, ale może próbować swoich sił w alternatywnych działaniach. Przez ostatnie dwa lata spółka metodycznie przejmuje mniejsze podmioty zajmujące się AI. W lipcu 2024 r. AMD przejęło Silo AI – największe europejskie laboratorium zajmujące się technologią sztucznej inteligencji. To właśnie ta transakcja miała być kluczowa dla ostatnich prac związanych z publikacją nowego modelu językowego. Nowe możliwości, jakie daje Silo AI, mogą znacząco wpłynąć na rozwój technologii oferowanych przez AMD. W rezultacie, firma może stać się poważnym graczem w obszarze sztucznej inteligencji, co w dłuższej perspektywie stwarza szansę na konkurencję z dominującymi graczami rynku. W kontekście rozwoju modeli językowych, interesujące będzie porównanie funkcji claude i chatgpt, które mogą oferować różne podejścia do generowania treści.

Pierwszy model językowy AMD – poznajcie OLMo!

Najnowszy model językowy, AMD OLMo (wersja 1B) obsługuje ponad miliard parametrów. Został stworzony z myślą o zaawansowanych zastosowaniach sztucznej inteligencji na potrzeby rynku IT. Model ten jest wynikiem intensywnego treningu na podstawie 1,3 biliona tokenów i wykorzystuje architekturę Transformer, znaną m.in. z ChatGPT, do przewidywania następnych tokenów. Model AMD OLMo wprowadza także nowatorskie mechanizmy adaptacji, które pozwalają na dostosowywanie go do specyficznych potrzeb użytkowników. Dzięki temu, jak działa aktualizacja modeli llm, możliwe jest ciągłe doskonalenie algorytmów i podnoszenie ich efektywności w różnych zastosowaniach. Umożliwia to nie tylko lepsze wyniki w zadaniach związanych z przetwarzaniem języka naturalnego, ale także szersze zastosowanie w innych dziedzinach technologicznych.

Jedną z najbardziej zaskakujących informacji przy premierze OLMo jest to, że model językowy AMD dostępny jest w 100% w formie open source. Każdy jest w stanie z niego skorzystać. Dowolną wersję sprzętową można pobrać za darmo z platformy Hugging Face. Dostępne są także zmodyfikowane wersje użytkowników, tworzone na bieżąco przez społeczność. Znaleźć można zarówno projekty dedykowane dla użytkowników amatorskich, do codziennego użytku, jak i specjalistyczne, obsługujące niszowe zadania. Dzięki temu każdy, niezależnie od poziomu umiejętności, ma szansę na eksperymentowanie z nowymi rozwiązaniami i rozwijanie własnych projektów. Warto również wspomnieć, że strona główna naszej witryny zawiera bogaty zestaw zasobów i dokumentacji, które mogą pomóc w lepszym zrozumieniu możliwości OLMo. Zaangażowana społeczność nieustannie dzieli się wiedzą, co sprawia, że rozwój modeli staje się jeszcze bardziej dynamiczny i dostępny.

Otwartoźródłowość to niejedyna ciekawa cecha AMD OLMo. Model osiąga wyniki porównywalne lub lepsze od innych modeli o podobnej wielkości w zakresie ogólnego rozumienia i zdolności konwersacyjnych. Wyposażone jest w możliwość fine-tuningu, która zapewnia lepsze dopasowanie modelu do użytkownika, jego intencji i specyficznych wymogów. Ponadto model został dostosowany z myślą o ogólnodostępnej ofercie procesorów AMD – serii AMD Ryzen z jednostkami NPU. Wykorzystując go na takim sprzęcie, użytkownik ma zaobserwować korzyści na poziomie ochrony prywatności oraz większej efektywności energetycznej. Dzięki zaawansowanej architekturze i innowacyjnym rozwiązaniom, model ten oferuje użytkownikowi nie tylko lepszą jakość interakcji, ale także możliwość dostosowywania go do specyficznych potrzeb. W kontekście analizy porównawczej, ’perplexity ai w porównaniu do chatgpt’ ukazuje różnice w podejściu do generowania odpowiedzi, co przekłada się na unikalne doświadczenia w zakresie interakcji AI. Użytkownicy mogą liczyć na bardziej spersonalizowane odpowiedzi i większą wszechstronność, co czyni AMD OLMo atrakcyjnym wyborem.

Zbliżenie na smartfona z logo procesora AMD Ryzen AI NPU, na klawiaturze komputera
Każdy może korzystać z modelu OLMo na desktopie z procesorem serii Ryzen AI.

AMD OLMo – specyfikacja techniczna i główne cechy

Parametry techniczne modelu AMD pokazują, że jest on w stanie konkurować z bardziej popularnymi modelami. AMD OLMo w liczbach to:

  • ponad 1 miliard obsługiwanych parametrów,
  • zestaw danych do treningu wynosząc 1,3 biliona tokenów (Dolma 1.7v.),
  • trening na klastrze 16 węzłów (cztery z procesorami AMD Instinct MI250),
  • architektura Transformer.

Model AMD OLMo przeznaczony jest do różnych zadań. Może być wykorzystywany między innymi do generowania treści, analizy kontekstów, wyszukiwania informacji, rozwiązywania zadań i problemów. Dużym atutem jest możliwości pre-treningu i fine-tuningu, co oznacza, że OLMo można dostosować do specyficznych potrzeb branżowych, dostosowując samodzielnie jego cechy.

Najbardziej wyróżniające cechy AMD OLMo spośród pozostałych modeli językowych dostępnych na rynku to: Jego zdolność do efektywnego przetwarzania kontekstu oraz generowania bardziej spójnych odpowiedzi przyciąga uwagę użytkowników i badaczy. Wprowadzenie innowacyjnych mechanizmów uczenia sprawia, że AMD OLMo reprezentuje nowe podejście do modeli językowych, które ma potencjał zrewolucjonizować sposób, w jaki interagujemy z technologią. Dzięki temu, użytkownicy mogą cieszyć się wyższą jakością komunikacji oraz lepszym zrozumieniem ich potrzeb.

  • model jest dostępny w wersji open-source dla platformie Hugging Face,
  • każdy może dowolnie edytować model według potrzeb (na platformie znajdziemy też gotowe odnogi),
  • OLMo umożliwia pre-trening i fine-tuning dostosowany do potrzeb,
  • wydajność modelu jest porównywalna z innymi modelami w benchmarkach rozumienia i konwersacji,
  • możliwość lokalnego uruchamiania na komputerach z procesorami Ryzen AI.

Możliwa fuzja AMD z Intelem?

Pomimo przewagi rynkowej Nvidii AMD rozpycha się na rynku zwłaszcza w odniesieniu do innych liderów. Obecnie AMD sprzedaje więcej centrów danych, niż Intel. Intensywna praca nad nowymi modelami językowymi, zapoczątkowana premierą OLMo, również powoli będzie czynnikiem wzrostu spółki. Wspomniany zaś Intel boryka się z gigantycznymi problemami finansowymi. Konsekwencje tych problemów odczuliśmy także w Polsce – Intel wstrzymał gigantyczne inwestycje w Polsce ze względu na zbyt wysokie koszty operacyjne projektu.

Intel jest jedną z tych firm, które są „za duże, by upaść”. Z perspektywy bezpieczeństwa narodowego utrata potencjału Intela w zakresie produkcji nowoczesnych chipów oznaczałaby wręcz automatyczne wzmocnienie chińskiego rynku. Ważnym czynnikiem jest także ustawa Chips Act, która ma na celu wsparcie przy budowie ogromnych zdolności produkcyjnych mikroprocesorów, które są strategicznym aktywem w rywalizacji gospodarczej między Waszyngtonem a Pekinem. Za szczególnie istotne zagrożenie uznaje się wzrost relewancji Huaweii, który skutecznie omija amerykańskie sankcje i zaczyna ostro rywalizować z amerykańskimi firmami, w tym m.in. z Apple.

Właśnie dlatego rząd USA naciska na fuzję AMD i Intela. Połączonymi podmiotami miałoby zarządzać właśnie AMD, a produkcja zostałaby wydzielona jako odrębna jednostka. Nie wiadomo, czy dojdzie do fuzji Intela z AMD. Eksperci wskazują, że połączenie znacznie poprawiłoby perspektywy obydwu firm, bo zamiast rywalizować ze sobą mogłyby skupić się na rywalizacji z zagranicznymi koncernami.

mikrochip, krzem, sztuczna inteligencja, półprzewodnik, procesor
Po połączeniu z Intelem AMD może stać się liderem w produkcji CPU i zwiększyć potencjał prac nad AI.

Sukcesy AMD mogą się opłacić – podsumowanie

AMD staje do tej konkurencji za Nvidią i osiąga imponujące wyniki jak na firmę wielokrotnie mniejszą i o znacznie niższym poziomie kapitalizacji. Najnowsze dzieło inżynierów to model językowy AMD OLMo, który zaskakuje nie tylko wydajnością (model obsługuje ponad miliard parametrów), ale możliwością kompleksowego dostosowania do własnych potrzeb. Dzięki publikacji modelu w formie open source i udostępnieniu wszystkich katalogów na platformie Hugging Face, każdy jest w stanie zacząć korzystać z narzędzia AMD. Dodatkowe opcje treningu sprawiają, że oprogramowanie można przekształcać w bardziej niszowe i eksperckie rozwiązania, przeznaczone dla konkretnych branż. Sukcesy AMD nie sprawiają, że pozycja spółki jest mniej zagrożona względem Nvidii. Przekładają się jednak na wzrost szans kolejnych przejęć firmy. Bardzo możliwe, że następnym przejęciem po Silo AI będzie prawdziwy gigant, Intel, którego w ramach fuzji AMD miałoby wchłonąć w swoje struktury organizacyjne. Czynniki geopolityczne związane z rywalizacją z Chinami w zakresie produkcji mikroprocesorów i technologii półprzewodników sprawiają, że z miesiąca na miesiąc są coraz większe szanse na powstanie nowego, wielkiego giganta.

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *