AMD nie powiedziało jeszcze ostatniego słowa i powoli stara się gonić gigantów na rynku AI. Chociaż firma głównie konkuruje z Intelem w zakresie produkcji specjalistycznych procesorów do trenowania modeli językowych, ostatni sukces AMD polega na opracowaniu własnego modelu. I to nie byle jakiego, bo AMD OLMo obsługuje ponad 1 miliard parametrów, a dane treningowe obejmowały 1,3 biliona tokenów. Liczy imponują, ale w kontekście rosnącej przewagi rynkowej Intel pojawiają się pytania o możliwą fuzję. Sprawdzamy, jak działa i do czego służy najnowszy model językowy AMD OLMo oraz jakie mogą być dalsze konsekwencje dla AMD!
AMD nie wycofuje się z wyścigu AI
AMD nie wycofuje się z rywalizacji na rynku sztucznej inteligencji. Dobitnie świadczy o tym prezentacja najnowszego modelu językowego – AMD OLMo. To pierwszy model językowy giganta, który został opracowany pod CEO, Lisy Su oraz CTO i wiceprezesa, Marka Papermastera. Branża komentuje, że po niespodziewanym sukcesie Nvidii i OpenAI AMD zdołało szybko zebrać szyki i dostosować się do nowych warunków gry, tworząc samodzielnie innowacyjne rozwiązania w zakresie sztucznej inteligencji.
Chociaż w zakresie GPU wykorzystywanych przez AI prym wiedzie Nvidia, komentatorzy wskazują, że sukces najwyżej wycenianej spółki świata kształtował się przez ostatnie lat. Samą dziedziną sztucznej inteligencji Nvidia zajmowała się już od dawna. W latach, gdy nie było jeszcze w ogóle mowy o AI tak, jak dziś, Nvidia stopniowo poszerzała paletę produktów elitarnych, tworzonych dla firm IT, o specjalistyczne chipsety GPU konstruowane z myślą o przetwarzaniu niezliczonych bazach danych. Opracowanie własnego modelu językowego na pewno zapisze się na kartach historii spółki jako nowy etap, w którym AMD nie tylko dostarcza infrastrukturę techniczną na potrzeby procesu trenowania modeli, ale również opracowuje gotowe rozwiązania.
AMD vs Nvidia: strategia wobec dominującego giganta
Kiedy światło dzienne ujrzał ChatGPT pod koniec 2022 r., wszyscy zastanawiali się, jaki sprzęt wykorzystywany był do tworzenia tak zaawansowanych modułów, które muszą korzystać z olbrzymiej mocy obliczeniowej i które trenowane są na gigantycznych zbiorach danych. Nvidia zaskoczyła rynek, gdy okazało się, że odpowiada praktycznie wyłącznie za chipsety GPU zarówno dla Microsoft Copilot, jak i ChatGPT OpenAI. Na sukces ten Nvidia pracowała dwie dekady. To właśnie dzięki AI obecnie jest spółką giełdową o najwyższym poziomie kapitalizacji rynkowej na świecie.
Koncentracja na rynku podzespołów wykorzystywanych do szkolenia modeli językowych jest ogromna. Nvidia zajmuje tu ponad 75% rynku. AMD nie ma szans w bezpośredniej konkurencji, ale może próbować swoich sił w alternatywnych działaniach. Przez ostatnie dwa lata spółka metodycznie przejmuje mniejsze podmioty zajmujące się AI. W lipcu 2024 r. AMD przejęło Silo AI – największe europejskie laboratorium zajmujące się technologią sztucznej inteligencji. To właśnie ta transakcja miała być kluczowa dla ostatnich prac związanych z publikacją nowego modelu językowego.
Pierwszy model językowy AMD – poznajcie OLMo!
Najnowszy model językowy, AMD OLMo (wersja 1B) obsługuje ponad miliard parametrów. Został stworzony z myślą o zaawansowanych zastosowaniach sztucznej inteligencji na potrzeby rynku IT. Model ten jest wynikiem intensywnego treningu na podstawie 1,3 biliona tokenów i wykorzystuje architekturę Transformer, znaną m.in. z ChatGPT, do przewidywania następnych tokenów.
Jedną z najbardziej zaskakujących informacji przy premierze OLMo jest to, że model językowy AMD dostępny jest w 100% w formie open source. Każdy jest w stanie z niego skorzystać. Dowolną wersję sprzętową można pobrać za darmo z platformy Hugging Face. Dostępne są także zmodyfikowane wersje użytkowników, tworzone na bieżąco przez społeczność. Znaleźć można zarówno projekty dedykowane dla użytkowników amatorskich, do codziennego użytku, jak i specjalistyczne, obsługujące niszowe zadania.
Otwartoźródłowość to niejedyna ciekawa cecha AMD OLMo. Model osiąga wyniki porównywalne lub lepsze od innych modeli o podobnej wielkości w zakresie ogólnego rozumienia i zdolności konwersacyjnych. Wyposażone jest w możliwość fine-tuningu, która zapewnia lepsze dopasowanie modelu do użytkownika, jego intencji i specyficznych wymogów. Ponadto model został dostosowany z myślą o ogólnodostępnej ofercie procesorów AMD – serii AMD Ryzen z jednostkami NPU. Wykorzystując go na takim sprzęcie, użytkownik ma zaobserwować korzyści na poziomie ochrony prywatności oraz większej efektywności energetycznej.
AMD OLMo – specyfikacja techniczna i główne cechy
Parametry techniczne modelu AMD pokazują, że jest on w stanie konkurować z bardziej popularnymi modelami. AMD OLMo w liczbach to:
- ponad 1 miliard obsługiwanych parametrów,
- zestaw danych do treningu wynosząc 1,3 biliona tokenów (Dolma 1.7v.),
- trening na klastrze 16 węzłów (cztery z procesorami AMD Instinct MI250),
- architektura Transformer.
Model AMD OLMo przeznaczony jest do różnych zadań. Może być wykorzystywany między innymi do generowania treści, analizy kontekstów, wyszukiwania informacji, rozwiązywania zadań i problemów. Dużym atutem jest możliwości pre-treningu i fine-tuningu, co oznacza, że OLMo można dostosować do specyficznych potrzeb branżowych, dostosowując samodzielnie jego cechy.
Najbardziej wyróżniające cechy AMD OLMo spośród pozostałych modeli językowych dostępnych na rynku to:
- model jest dostępny w wersji open-source dla platformie Hugging Face,
- każdy może dowolnie edytować model według potrzeb (na platformie znajdziemy też gotowe odnogi),
- OLMo umożliwia pre-trening i fine-tuning dostosowany do potrzeb,
- wydajność modelu jest porównywalna z innymi modelami w benchmarkach rozumienia i konwersacji,
- możliwość lokalnego uruchamiania na komputerach z procesorami Ryzen AI.
Możliwa fuzja AMD z Intelem?
Pomimo przewagi rynkowej Nvidii AMD rozpycha się na rynku zwłaszcza w odniesieniu do innych liderów. Obecnie AMD sprzedaje więcej centrów danych, niż Intel. Intensywna praca nad nowymi modelami językowymi, zapoczątkowana premierą OLMo, również powoli będzie czynnikiem wzrostu spółki. Wspomniany zaś Intel boryka się z gigantycznymi problemami finansowymi, o czym pisaliśmy już wcześniej w artykule pt.: Wszystkie problemy Intela: porażka Intel Arc, rosnąca konkurencja i fałszywe plotki o przejęciu przez Qualcomm. Konsekwencje tych problemów odczuliśmy także w Polsce – Intel wstrzymał gigantyczne inwestycje w Polsce ze względu na zbyt wysokie koszty operacyjne projektu.
Intel jest jedną z tych firm, które są „za duże, by upaść”. Z perspektywy bezpieczeństwa narodowego utrata potencjału Intela w zakresie produkcji nowoczesnych chipów oznaczałaby wręcz automatyczne wzmocnienie chińskiego rynku. Ważnym czynnikiem jest także ustawa Chips Act, która ma na celu wsparcie przy budowie ogromnych zdolności produkcyjnych mikroprocesorów, które są strategicznym aktywem w rywalizacji gospodarczej między Waszyngtonem a Pekinem. Za szczególnie istotne zagrożenie uznaje się wzrost relewancji Huaweii, który skutecznie omija amerykańskie sankcje i zaczyna ostro rywalizować z amerykańskimi firmami, w tym m.in. z Apple.
Właśnie dlatego rząd USA naciska na fuzję AMD i Intela. Połączonymi podmiotami miałoby zarządzać właśnie AMD, a produkcja zostałaby wydzielona jako odrębna jednostka. Nie wiadomo, czy dojdzie do fuzji Intela z AMD. Eksperci wskazują, że połączenie znacznie poprawiłoby perspektywy obydwu firm, bo zamiast rywalizować ze sobą mogłyby skupić się na rywalizacji z zagranicznymi koncernami.
Sukcesy AMD mogą się opłacić – podsumowanie
AMD staje do tej konkurencji za Nvidią i osiąga imponujące wyniki jak na firmę wielokrotnie mniejszą i o znacznie niższym poziomie kapitalizacji. Najnowsze dzieło inżynierów to model językowy AMD OLMo, który zaskakuje nie tylko wydajnością (model obsługuje ponad miliard parametrów), ale możliwością kompleksowego dostosowania do własnych potrzeb. Dzięki publikacji modelu w formie open source i udostępnieniu wszystkich katalogów na platformie Hugging Face, każdy jest w stanie zacząć korzystać z narzędzia AMD. Dodatkowe opcje treningu sprawiają, że oprogramowanie można przekształcać w bardziej niszowe i eksperckie rozwiązania, przeznaczone dla konkretnych branż. Sukcesy AMD nie sprawiają, że pozycja spółki jest mniej zagrożona względem Nvidii. Przekładają się jednak na wzrost szans kolejnych przejęć firmy. Bardzo możliwe, że następnym przejęciem po Silo AI będzie prawdziwy gigant, Intel, którego w ramach fuzji AMD miałoby wchłonąć w swoje struktury organizacyjne. Czynniki geopolityczne związane z rywalizacją z Chinami w zakresie produkcji mikroprocesorów i technologii półprzewodników sprawiają, że z miesiąca na miesiąc są coraz większe szanse na powstanie nowego, wielkiego giganta.