Nowa wersja ChatGPT? 4o to duży postęp, ale zabrakło konkretnych informacji o Search GPT 

Najnowsza prezentacja OpenAI miała mieć rewolucyjne znaczenie zarówno dla branży A.I., jak i SEO. Wyszło jednak trochę inaczej. OpenAI nie przedstawiło kluczowych informacji na temat projektu, który do czerwoności nagrzewa społeczność SEO/SEM, czyli nową wyszukiwarkę internetową opartą na GPT. Zamiast tego doświadczyliśmy prezentacji nowej wersji modelu językowego, z którego można korzystać również w formie darmowej. Mowa o GPT-4o

Jeszcze nie czas na nową wyszukiwarkę. OpenAI prezentuje najnowszą aktualizację 

OpenAI właśnie zaprezentowało nową, dużą aktualizację ChatGPT. Współzałożyciel i CEO Open AI, Sam Altman, zapowiadał szereg nowości dotyczących ChatGPT i GPT-4, modelu AI, najbardziej rozbudowanej wersji modelu językowego napędzającego chatbota, który jest dostępny w wersji subskrypcyjnej. “Wiosenna aktualizacja”, jak oficjalnie nazwano wprowadzane zmiany, została zaprezentowana o godz. 13.00 czasu wschodniego (ET) w poniedziałek. 

Ostatnio na blogu pisaliśmy o najnowszych doniesieniach Financial Times i Bloomberg. Rzekome przecieki dotyczące zbliżającej się aktualizacji pojawiły się pod koniec poprzedniego tygodnia. Według anonimowych źródeł agencji mediowych OpenAI miało zamiar ogłosić konkurenta dla wyszukiwarki Google. Wcześniej pisaliśmy również o tym, że została uruchomiona nowa subdomena: search.chatgpt.com, której powstanie bezpośrednio wiąże się z planami otwarcia nowej alternatywy dla wyszukiwarki Google Search. 

Chociaż temperatura związana z poniedziałkowym wydarzeniem zdążyła już osiągnąć niebotyczne poziomy, niedługo przed początkiem prezentacji Altman ostudził nieco oczekiwania. Prezes OpenAI zapowiedział, że w trakcie wydarzenia nie zostaną ujawnione ani zupełnie nowa wersja GPT-5, ani nowa wyszukiwarka OpenAI, która podobno jest w przygotowaniu. GPT-5 ma podobno wykorzystywać nową wersję architektury Transformer, ale informacje na ten temat są niezwykle ograniczone. OpenAI planuje w przyszłości rzucić wyzwanie gigantowi wyszukiwarek internetowych, Google, swoim własnym produktem wyszukiwania napędzanym przez AI. Jak się jednak okazało, czas na to jeszcze nie nastał. 

Aktualizacja wprowadza nowy model językowy: GPT-4o

Kwestie związane z wyszukiwarką OpenAI są więc na ten moment zamknięte. Brakuje informacji na temat tego, kiedy firma zdecyduje się podzielić szczegółami związanymi z tym – przynajmniej dla branży SEO/SEM – najbardziej przełomowym projektem. Czego zatem dowiedzieliśmy się podczas poniedziałkowego wydarzenia i co wprowadza Spring Update OpenAI? 

Prezentacja odbyła się na żywo, bez udziału publiczności, z małego, niepozornego studia. Prowadziła je CTO Open AI, Mira Murati. W wydarzeniu nie brał udziału Sam Altman.

Najważniejszą wiadomością w poniedziałek było pojawienie się nowego, flagowego modelu ChatGPT – GPT-4o. Z nowego modelu można korzystać za darmo już teraz, globalnie (także w Polsce). Korzystają z niego zarówno nowi użytkownicy, jak i dotychczasowi. Według informacji, które pojawiły się w trakcie prezentacji, ChatGPT-4o „potrafi rozumować w czasie rzeczywistym w oparciu o dźwięk, obraz i tekst”. Litera ma pochodzić od omni, czyli wszystkiego. Najnowsza wersja ma bowiem odpowiadać za “wszystko”, a nie tylko za prace związane z tekstem. 

W trakcie pokazu Murati zaprezentowała różne funkcje nowego modelu, pokazując zdolności GPT-4o do pracy w czasie rzeczywistym. Widać między innymi to, jak szybko nowy model ChatGPT jest w stanie tłumaczyć mowę i pomagać w podstawowych zadaniach algebraicznych, wykorzystując swoje możliwości wizualne. Wykorzystanie tej technologii w zadaniach szkolnych było od początku tematem budzącym kontrowersje w edukacji.

Czy nowy ChatGPT przejdzie test Turinga?

Nowy model językowy nastawiony jest przede wszystkim na różne funkcje związane z analizą obrazu i dźwięku. W demonstracyjnym wideo widać, jak ChatGPT analizuje otoczenie, zauważa, że jest to zestaw do nagrywania, domyśla się, że może mieć to coś wspólnego z OpenAI, ponieważ użytkownik ma na sobie hoodie, a następnie zostaje poinformowany, że ogłoszenie dotyczy sztucznej inteligencji. Na końcu model konkluduje samodzielnie, że to on jest modelem A.I. 

Umiejętności identyfikacji swojej tożsamości – a może bardziej: posiadania tożsamości w ogóle – byłyby zadziwiające i świadczyłyby z pewnością o tym, że model przeszedłby pozytywnie testy na inteligencję. Przypomnijmy, że w lipcu 2023 r. prestiżowe czasopismo naukowe Nature informowało o tym, że ChatGPT złamał test Turinga. Informacji towarzyszyła jednak powszechna dezaprobata środowiska naukowego. Konkluzja jest taka, że ChatGPT potrafi doskonale naśladować pewne działania i zachowania, które mogłyby świadczyć o świadomym działaniu, ale bynajmniej nim nie są. Tak również należy traktować najnowszą prezentację możliwości GPT-4o, pomijając wątpliwości związane z tym, że wideo mogło być stworzone wcześniej w sztuczny sposób. 

Nowe funkcje ChatGPT-4o – interpretacja dźwięku i obrazu, tłumaczenia w czasie rzeczywistym i web browsing

Nie zmienia to faktu, że najnowsza wersja, GPT-4o, posiada szereg nowych funkcji związanych z obrazem, wideo i dźwiękiem. Wersja desktopowa ChatGPT ma teraz nowy, ulepszony interfejs użytkownika. Aby sprawdzić, jakie są aktualnie dostępne funkcje w wersji 4o, można zresztą samodzielnie zapytać modelu. Na nasze pytanie wymienił następujące opcje: 

  • GPT-4o Model – interpretacja instrukcji za pomocą tekstu, dźwięku i obrazu oraz odpowiedzi w tych samych trybach,
  • Real-time Translation – tłumaczenie w czasie rzeczywistym za pomocą głosu,
  • Code Interpretation – opisanie kodu oprogramowania na głos w konwersacyjnym języku angielskim,
  • Math Equations – odpowiadanie na pisemne równania matematyczne za pomocą głosu,
  • Handwritten Messages – odpowiadanie na wiadomości pisane ręcznie,
  • Free Tier Enhancements – ograniczony dostęp do GPT-4o dla użytkowników darmowej wersji,
  • Web Browsing – dostęp do przeglądania internetu,
  • Advanced Data Analysis – zaawansowana analiza danych,
  • GPT Store – dostęp do sklepu z aplikacjami GPT (wersja App Store od OpenAI).

ChatGPT-4o wypisuje nowe funkcje, które są dostępne dla użytkowników, którzy wcześniej korzystali z darmowej wersji GPT-3.5

Wyżej wymienione opcje miały być wcześniej niedostępne dla kont, które nie korzystały z wersji subskrypcyjnej (GPT-4), tylko darmowej (GPT-3.5). Warto jednak zauważyć, że nowa aktualizacja nie czyni jako tako rewolucji w zakresie dostępu do nowych rozwiązań. Część rozwiązań wersji GPT-4 została przeniesiona do GPT-4o, przy czym z pewnymi ograniczeniami. 

Na pierwszy rzut oka największym ograniczeniem jest czas generowania odpowiedzi, co szczególnie przeszkadza w przypadku korzystania z opcji web browsing za darmo. Niemniej jednak plusem jest to, że teraz nawet bez subskrypcji możemy wyszukać przy pomocy ChatGPT informacji ze świata, w tym z Polski. Co więcej, pomimo ograniczenia rozwiązania OpenAI pod względem czasu generowania odpowiedzi i tak działają lepiej, niż Microsoft Copilot.

Odpowiedź ChatGPT-4o na prompt “podaj najnowsze wiadomości z Polski” wygenerowana w darmowej wersji przy wykorzystaniu przeszukiwania zasobów sieciowych.

Odpowiedź ChatGPT-4o na prompt “podaj najnowsze wiadomości z Polski” wygenerowana w darmowej wersji przy wykorzystaniu przeszukiwania zasobów sieciowych. 

Wyszukiwanie głosowe i ograniczenia wersji 4o

Najnowsza aktualizacja modelu GPT-4o od OpenAI wprowadza innowacyjne funkcje, które znacząco rozszerzają możliwości interakcji użytkownika z systemem. Nowy model potrafi interpretować instrukcje użytkowników dostarczane za pomocą tekstu, dźwięku i obrazu — i odpowiadać we wszystkich trzech trybach. Przykładowo, użytkownicy mogą pokazać ChatGPT kod oprogramowania, a chatbot opisze na głos, w konwersacyjnym języku angielskim, co ten kod robi (w przyszłości mają być konsekwentnie dodawane nowe języki do trybu głosowego). Użytkownicy mogą również poprosić ChatGPT-4o o tłumaczenie w czasie rzeczywistym – również za pomocą głosu. ChatGPT w reakcji na polecenie głosowe może też odpowiadać pisemne w formie równań matematycznych i kodu.

Użytkownicy ChatGPT-3.5, którzy teraz otrzymują za darmo wersję GPT-4o, ale w wersji ograniczonej, nie mogą w pełni wykorzystywać wszystkich powyższych funkcji. Można jednak odczuć różnicę w wielu aspektach, m.in. wspomnianej wcześniej opcji przeszukiwania zasobów sieciowych, jak również zaawansowanej analizy danych, analiz matematycznych i usług GPT Store (wersji App Store od OpenAI). Abonenci będą mieli limit wiadomości, który jest pięciokrotnie większy.

Specjalistyczne funkcje nowej wersji ChatGPT

Jedną z nowych funkcji jest interpretacja kodu (Code interpretation), która pozwala na opisanie kodu oprogramowania w trybie głosowym w trakcie konwersacji w języku angielskim. Ta funkcja jest szczególnie przydatna dla programistów i studentów informatyki, którzy mogą otrzymać jasne i zrozumiałe wyjaśnienia działania kodu bez konieczności analizowania jego struktury linijka po linijce. Narzędzie OpenAI automatycznie analizuje składnię i semantykę kodu, identyfikując kluczowe elementy i ich funkcje, co usprawnia proces nauki i debugowania.

Kolejną zaawansowaną funkcją o przeznaczeniu specjalistycznym, które Spring Update wprowadza do repertuaru GPT-4o za darmo, jest funkcja odpowiadania na równania matematyczne (Math equations). Na czym polega? Przede wszystkim użytkownicy mogą teraz przedstawiać chatbotowi pisemne równania matematyczne, a system odpowiada na nie za pomocą głosu. Funkcjonalność ta pozwala na szybkie i efektywne rozwiązywanie problemów matematycznych, co jest nieocenione w edukacji oraz w profesjonalnych zastosowaniach technicznych. System potrafi przetwarzać zarówno proste, jak i złożone równania, dostarczając szczegółowych objaśnień krok po kroku, co wspiera proces zrozumienia zagadnień matematycznych. Jak wskazano w trakcie demonstracji prowadzonej na żywo przez Murati, opcja ta szczególnie istotna może być dla uczniów na różnym poziomie edukacji. Obydwie funkcje – interpretacja kodu i rozwiązywanie równań matematycznych – mają być rezultatem bardziej zaawansowanych zmian algorytmicznych wewnątrz modelu ChatGPT. 

Mira Murati w trakcie prezentacji ChatGPT-4o. Materiały prasowe OpenAI.

Mira Murati w trakcie prezentacji ChatGPT-4o. Materiały prasowe OpenAI. 

Zmiany cen w wersji ChatGPT-4o

Cześć,

Wprowadziliśmy GPT-4o w API, nasz nowy flagowy model, który jest tak samo inteligentny jak GPT-4 Turbo, ale znacznie bardziej wydajny. Korzyści dla deweloperów obejmują:

  • 50% niższe ceny: GPT-4o jest o połowę tańszy niż GPT-4 Turbo (5 USD za 1 milion tokenów wejściowych i 15 USD za 1 milion tokenów wyjściowych).
  • 2x szybsza latencja.
  • 5x wyższe limity szybkości.

GPT-4o obsługuje teraz tekst i możliwości wizualne, ma lepsze wsparcie dla języków innych niż angielski, 128k okno kontekstowe i datę ograniczenia wiedzy na październik 2023. Planujemy wkrótce wprowadzić obsługę audio i wideo.

Zalecamy deweloperom korzystającym z GPT-4 lub GPT-4 Turbo przejście na GPT-4o. Można uzyskać dostęp przez Chat Completions API, Assistants API lub Batch API z 50% zniżką na zadania asynchroniczne w ciągu 24 godzin.

Nowa wersja ChatGPT – podsumowanie

Dzięki technologii rozpoznawania obrazów i dźwięków model GPT-4o może przetwarzać instrukcje użytkowników dostarczane w różny sposób, a następnie odpowiadać w tych samych trybach. Integracja tych możliwości dodaje wszechstronności, przy czym sama w sobie nie wprowadza żadnych rewolucyjnych zmian. Trudno oczekiwać, aby w tej chwili użytkownicy tłumnie przestawiali się na korzystanie z rozwiązań głosowych. Tego typu rozwiązania są zresztą kontrowersyjne, o czym świadczą między innymi porażki Google w zakresie wyszukiwania głosowego, wobec którego czyniono ogromne plany. Ostatecznie jednak opcja ta spopularyzowała się de facto jedynie w Australii. 

Wszystkie inne zmiany, a więc m.in. tłumaczenia w czasie rzeczywistym, dostęp do przeglądania zasobów sieciowych czy zaawansowana analiza danych, na pewno należy oceniać pozytywnie, ale również nie są one rewolucyjne. Najnowsza aktualizacja OpenAI to bardziej zbiór fajnych dodatkowych i usprawnień, niż otwieranie nowego wymiaru. Najbardziej cieszyć się mogą chyba Ci użytkownicy, którzy dotąd korzystali jedynie z bezpłatnej wersji ChatGPT, ponieważ ta ma teraz dostęp do ograniczonych, ale jednak przydatnych, nowych funkcji. Pozostali mogą czuć się zawiedzeni – zwłaszcza w kontekście fenomenalnych zapowiedzi dotyczących nowej wyszukiwarki OpenAI, która miała bazować na sztucznej inteligencji. 

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *