Rozmowy na temat modułów językowych A.I. w 99% dotyczą Chat GPT – autorskiego rozwiązania Open A.I. Szukając innych przykładów, trafimy na najbardziej znanego konkurenta – Google ze swoim modułem Google Bard opartym na algorytmach PaLM. Do gry jednak wkroczył także chiński gigant technologiczny, Baidu, który właśnie zaktualizował swój moduł A.I., Ernie, do wersji 4.0. Czy Ernie 4.0 zdoła przegonić pod względem technologicznym Chat GPT? A może już się to stało? Zachęcamy do zapoznania się z naszą analizą porównawczą dwóch modułów: Chat GPT i Ernie!
Chiński projekt sztucznej inteligencji. Wprowadzenie
W pierwszym kwartale 2023 roku technologiczny gigant Baidu zapowiedział uruchomienie nowego modułu językowego Ernie. Podobnie, jak Chat GPT zespołu Open A.I. oraz Bard od Google, Ernie w zamierzeniu miał być kompleksowym modułem A.I. pozwalającym na wszechstronne zastosowanie.
Od tego czasu informacje przenikające do mediów były bardzo skromne. Wiadomo było, że powstają kolejne wersje chińskiej propozycji, chociaż nie ujawniano wielu szczegółów. Wiadomo też, że nawet sposób nazywania kolejnych wersji Chińczycy bezpośrednio zapożyczyli od twórców z Open A.I., co jeszcze bardziej podgrzewało atmosferę związaną z tematem ewentualnej kradzieży przemysłowej. Nie wiadomo bowiem, od kiedy Baidu faktycznie prowadził prace nad A.I. i na ile proponowane rozwiązanie jest pomysłem autorskim.
Latem 2023 r. zaprezentowano Erniego w wersji 3.0. W stosunku do poprzedniej wersji nastąpił ogromny wzrost liczby obsługiwanych parametrów, która ostatecznie wyniosła 1,4 miliarda parametrów. O chińskim module A.I. zrobiło się jednak głośno w połowie października 2023 r., kiedy Baidu oficjalnie zaprezentowało nową wersję. Ernie 4.0 obsługuje o 23% więcej parametrów względem starszego wariantu, z 1,4 mld do 1,7 mld i śmiało można powiedzieć, że ma przełomowy charakter jako moduł językowy A.I. w ogóle.
Ernie to nie Chat GPT. Specyficzne funkcjonalności i plany projektu Ernie
Wiele funkcji Ernie 4.0 jest jednak specyficznych. Od strony technologicznej wiele z nich bazuje na wykorzystaniu SDK (Software Development Kits) jako nakładek do głównego modułu. Do funkcji, które obecnie nie są dostępne w otwartych wersjach Chat GPT i Bard, należą:
- integracja rozpoznawania twarzy i odcisków palców z modułem językowym,
- synteza treści audiowizualnych,
- doskonałe przetwarzanie wyników wyszukiwarki Baidu i sieci partnerów Baidu,
- zaawansowane rozpoznawanie mowy i przetwarzanie mowy na tekst oraz vice versa,
- integracja z platformą do analiz wielowolumenowych Baidu Intelligent Cloud Qianfan,
- platforma edukacyjna Flying Paddle,
- sprzężenie inteligentnego monitoringu domowego z chmurą Ernie
- sprzężenie aplikacji wczesnego alarmowania Dumu z Ernie.
Warto nadmienić, że Ernie 4.0 ma być stosowany przede wszystkim przez Chińczyków i w obrębie chińskich sieci. To w dużym stopniu wyjaśnia oryginalność niektórych powyższych rozwiązań. Ernie całkowicie inaczej realizuje kwestie związane chociażby z prywatnością.
W Chińskiej Republice Ludowej, realizującej politykę scoringu społecznego, nie istnieje dyskurs związany z ochroną danych. Już teraz wiadomo, że Ernie ma być stopniowo zaangażowany w coraz więcej płaszczyzn społecznych, co sprawia, że jego możliwości będą na niespotykanym poziomie. Bardzo możliwe, że w wielu przypadkach ocena społeczna, a może także wymiar kar będzie zależeć od danych uzyskanych przy pomocy sprzężonych z Ernie’m aplikacji.
Ernie 4.0 – parametry i specyfikacja
Ernie 4.0 to potężne narzędzie, które będzie miało wpływ zarówno na biznes i przemysł, jak i na aspekty społeczne. W przeciwieństwie do pozostałych rozwiązań dostępnych na rynku Ernie nie jest tylko gigantycznym modułem językowym. Moduł językowy Ernie to rdzeń, do którego w formie SDK przyczepiane są nowe funkcjonalności, a wszystkie razem tworzą potężny, technologiczny kombajn.
Najważniejsze funkcje i cechy modułu Ernie 4.0:
- udoskonalone rozumienie zapytań – Ernie w wersji 4.0 ma znacznie poprawioną zdolność do rozumienia także specyficznych promptów. Zgodnie z oficjalnymi komunikatami Baidu, priorytetem wczesnego etapu rozwoju jest maksymalne dostosowanie Ernie’go na potrzeby odbiorców chińskich, nie anglojęzycznych. Już teraz Ernie jest na tym rynku niezastąpiony, rozumiejąc mandaryński najlepiej ze wszystkich rozwiązań na rynku.
- funkcje pamięciowe – Ernie nie tylko ma zdolność do generowania bardziej zaawansowanych i kontekstowych odpowiedzi, ale również poprawie uległy funkcje pamięci. Umożliwiają one lepsze radzenie sobie z dłuższymi sekwencjami informacji i zachowywanie kontekstu.
- szybkość generowania treści – Ernie 4.0 to jeszcze wyższa zdolność do generowania treści, takiej jak reklamy samochodowe, rozwiązania skomplikowanych problemów matematycznych oraz tworzenie fabuł od zera. Wszystko jest w stanie wykonać od zera w przeciągu kilku sekund.
- doskonała integracja z innymi chińskimi systemami i aplikacjami – Ernie 4.0 jest w pełni zintegrowany z wieloma aplikacjami funkcjonalnymi, programami komercyjnymi, jak i oprogramowaniem wykorzystywanym przez chiński rząd.
- pełna integracja z Baidu – Ernie ma czerpać z wyszukiwarki Baidu nawet w wyższym stopniu, niż Google Bard z Google Search.
- ograniczenie wyników zgodnie z wymogami chińskiej cenzury – Ernie jest w pełni kontrolowany przez chińskie władze.
Zastosowanie Ernie 4.0
Deklaratywnie, jak wynika z wypowiedzi przedstawicieli Baidu, Ernie ma mieć zdolność do rywalizacji z zaawansowanymi modelami sztucznej inteligencji, takimi jak GPT-4 od Open A.I., co sugeruje szybki postęp biorąc pod uwagę fakt, że po raz pierwszy dowiedzieliśmy się o nim na początku 2023 roku. To, co sprawia, że Ernie 4.0 już teraz jest bardziej wszechstronny i wydajny, to integracja z innymi aplikacjami i skala działania. Brak respektowania polityki prywatności, a także warunki chińskiego systemu nadzoru społecznego, sprawiają w rezultacie, że model ten może mieć znacznie więcej danych do szkolenia. Dotyczy to również behawiorystyki i danych nie opartych na kodzie, tj. m.in. analizy wideo obrazu monitoringu.
Bez wątpienia Ernie ma ogromną przyszłość w Chinach i ewentualnie w innych państwach niedemokratycznych. Wątpliwa jest popularyzacja modułu w Stanach Zjednoczonych czy w państwach członkowskich Unii Europejskiej chociażby ze względu na problemy prawne. Już teraz zakłada się jednak, że implementacja modułu Ernie ma odpowiadać za chińską transformację i przyspieszać politykę Made in China 2025, której głównym celem jest przestawienie przemysłu z ilości na jakość i postęp cyfryzacyjny.
Chat GPT 4.0 vs Baidu Ernie 4.0 – tabela porównawcza
Obydwa moduły językowe należą do najbardziej elitarnych, jakie dotąd znamy. Nie są nastawione jedynie na prace contentowe i wsparcie przy wyszukiwaniu, jak np. Google Bard. Chat GPT 4.0 i Ernie 4.0 mają zdecydowanie więcej cech wspólnych, niż różnic. Fakt ten staje się jednak rosnącym zagrożeniem dla Open A.I., które mimo wysokiej pozycji na rynku może mieć trudność z konkurowaniem z chińskim gigantem (Baidu) mającym wsparcie chińskiego rządu.
Główne różnice między Chat GPT 4.0 a Baidu Ernie 4.0 przedstawia poniższa tabela:
Kryterium | Chat GPT 4.0 | ERNIE 4.0 |
---|---|---|
Obszar zastosowania | Wirtualny asystent, konwersacje człowiek-chatbot | Wsparcie dla wielu języków, tekst, obrazy, audio, wideo |
Język | Początkowo angielski, rozszerzenie do 26 języków (ChatGPT 4) | Język podstawowy: chiński mandaryński i angielski, przewidywane dodanie kolejnych języków |
Model językowy | GPT (Generative Pre-trained Transformer) | ERNIE (Enhanced Representation from Knowledge Integration) |
Dane treningowe | Obszerne dane tekstowe z rozwijającymi się rodzajami danych | Obszerne dane tekstowe z naciskiem na chiński mandaryński |
Aktualizacje modelu | Stały rozwój i aktualizacje | Stały rozwój i aktualizacje |
Zastosowania praktyczne | Wirtualny asystent, generowanie tekstu, rozwiązywanie problemów | Przetwarzanie tekstu, obrazów, dźwięku, wideo; obsługa danych w czasie rzeczywistym |
Plan integracji z wyszukiwarką | Microsoft Bing | Stopniowa integracja z Baidu Search, Maps, Business Tools, i Cloud Services |
Bezpieczeństwo i cenzura | Zgodność z politykami OpenAI, restrykcyjne podejście do prezentowania treści potencjalnie krzywdzących lub szkodliwych | Przestrzeganie chińskich zasad cenzury obejmującej zarówno wyrażenia potencjalnie krzywdzące lub szkodliwe, jak i wyrażenia mogące niewłaściwie świadczyć o chińskim reżimie |
Chat GPT vs Baidu Ernie – podsumowanie
Nowa wersja Ernie 4.0 pokazuje, że powinniśmy baczniej przyglądać się rozwojowi sztandarowego projektu nie tylko Baidu, ale i chińskiego rządu. Ernie 4.0 stanowi rewolucję w dziedzinie sztucznej inteligencji, reprezentując wyjątkowy postęp w rozwoju modeli generatywnych poprzez jego integrację z modułami rozwojowymi (SDK). Udoskonalone rozumienie zapytań, znacznie poprawione funkcje pamięci oraz zdolność do generowania zaawansowanych treści sprawiają, że jest to model o niezwykle wszechstronnym zastosowaniu. I chociaż na ten moment zaawansowane funkcje językowe dotyczą przede wszystkim języka mandaryńskiego, jest tylko kwestią czasu, kiedy zostaną one zaimplementowane w obrębie innych języków.
Jasne jest także, że Ernie 4.0 od Baidu oznacza kolejny krok w rywalizacji między głównymi podmiotami opracowującymi moduły językowe A.I. W porównaniu z Chat GPT 4.0, najnowsza odsłona Ernie wyróżnia się szczególnie w zakresie obsługi modułów dodatkowych oraz przetwarzania mowy, materiałów audiowizualnych, a także – poprzez SDK – wykorzystywania technologii rozpoznawania twarzy.
Na ten moment Ernie 4.0 wyróżniać zwłaszcza w kontekście chińskiego rynku, podczas gdy Chat GPT 4.0 przyciąga uwagę międzynarodową za sprawą rozwiniętego wsparcia dla wielu języków. Obydwa modele mają więc unikalne cechy, które odpowiadają głównemu zapotrzebowaniu. Jak pokazaliśmy, nadrzędne cele dla Ernie 4.0 to przede wszystkim realizacja polityki rządowej ChRL. Kolejne miesiące pokażą, w którym kierunku faktycznie zmierza chińska sztuczna inteligencja.