ChatGPT wprowadza komunikację głosową

OpenAI nie zawiodło oczekiwań i zgodnie z zapowiedziami wprowadziło właśnie nową usługę głosową. Za pomocą zwykłego telefonu, nawet nie smartfona, możemy teraz porozumiewać się z modelem językowym i pytać go dosłownie o wszystko to, co normalnie piszemy w oknie czatu. Chociaż usługa dopiero jest wprowadzana i nie jest jeszcze dostępna dla większości państw, pierwsze oceny są wyjątkowo pozytywne. Czy 1-800-ChatGPT przełoży się na popularność narzędzi OpenAI i pozwoli gigantowi skuteczniej odgrodzić się od konkurencji?

Nowa usługa OpenAI – komunikacja głosowa ChatGPT

OpenAI, firma stojąca za słynnym ChatGPT, wprowadza przełomowe rozwiązanie w zakresie sztucznej inteligencji. Modele językowe dotychczas wykorzystywaliśmy praktycznie jedynie w formie pisanej. Mogą one za nas wykonywać obliczenia, zadania, przygotowywać listy zakupowe, programować, tworzyć treści i generować obrazy. Nie mogą za to się porozumiewać głosowo. Pomijając w tym momencie vocodery AI i narzędzia do generowania muzyki (np. Suno, Udio), które są zupełnie odrębną bajką, sztuczna inteligencja dotychczas była po prostu niema.

Wprowadzenie usługi 1-800-ChatGPT wszystko zmienia. Nowa usługa umożliwia użytkownikom prowadzenie rozmów z ChatGPT przez telefon, wykorzystując tradycyjną linię stacjonarną lub komórkową. Już teraz zauważa się, że rozszerzenie to realnie może udostępnić zasoby AI dla potrzeb osób z niepełnosprawnościami, które nie są w stanie korzystać z chatbotów w tradycyjnej formie. Mówiąc zaś bardziej górnolotnie, wprowadzenie numeru 1-800-ChatGPT stanowi demokratyzację dostępu do sztucznej inteligencji. Użytkownicy nie potrzebują już zaawansowanych urządzeń, stabilnego połączenia internetowego ani nawet konta w serwisie. Wystarczy zwykły telefon, by rozpocząć interakcję z jednym z najbardziej zaawansowanych modeli językowych na świecie.

Porozmawiaj z ChatGPT przez telefon

W jaki sposób działa najnowsza usługa OpenAI? Komunikacja głosowa z ChatGPT wymaga jedynie skonfigurowania ChatGPT jako kontaktu, używając do tego numeru telefonu 1-800-ChatGPT. Przekładając końcówkę na liczby zgodnie z ich rozmieszczeniem na standardowej klawiaturze telefonu, pełny numer ChatGPT to 1-800-242-8478. Po dodaniu numeru do listy kontaktów w telefonie użytkownik może zadzwonić i porozmawiać z ChatGPT, aby uzyskać odpowiedzi.

W pierwszych zaprezentowanych testach zorganizowanych przez OpenAI uczestnicy dzwonili do ChatGPT za pomocą trzech urządzeń: iPhone’a, starego telefonu z klapką i telefonu z tarczą obrotową. Celem było udowodnienie, że każdy rodzaj aparatu telefonicznego jest akceptowalny – bez względu na jego poziom technologiczny. Z ChatGPT porozmawiamy więc wygodnie zarówno w domu, jak i możemy zadzwonić będąc w podróży. W dostępnych na stronie OpenAI materiałach promocyjnych widać (a przede wszystkim: słychać) jak ChatGPT tłumaczy dzwoniącemu czym jest zjawisko Reinforcement Learning tak, jakby odbiorcą było pięcioletnie dziecko.

1-800-ChatGPT – szczegóły techniczne i dostępność

Omawiana funkcja dostępna jest obecnie jedynie w Stanach Zjednoczonych. Jej wykorzystywanie zostało ograniczone do zaledwie 15 minut / miesiąc. Co jednak istotne – usługa jest dostępna dla wszystkich Amerykanów. Nie potrzeba posiadać konta OpenAI. Jeśli jednak takie konto mamy, nawet darmowe, to wówczas porozmawiamy dłużej, niż przez 15 minut. Brakuje jednak informacji, o ile dłużej. Wiadomo, że do płatnych planów subskrypcyjnych dodano już usługę 1-800-ChatGPT w formie nielimitowanej.

Nowa usługa OpenAI bazuje na modelu ChatGPT 4.0 Mini, który został specjalnie dostosowany do komunikacji głosowej. Nie jest to więc najpotężniejszy z dostępnych obecnie modeli językowych, co wskazuje, że mimo wszystko głosowa usługa raczej jest przeznaczona do codziennych potrzeb, niż wykonywania skomplikowanych zadań matematycznych. Według informacji na stronie OpenAI oddelegowany do pracy zespół inżynierów firmy opracował to rozwiązanie w zaledwie kilka tygodni, co ma dodatkowo wskazywać o możliwościach technicznych OpenAI. Szczegółowe informacje na temat projektu dostępne są stronie OpenAI.

Ikona kontaktu telefonicznego usługi 1-800-ChatGPT.

Integracja ChatGPT z WhatsApp

System został zaprojektowany z myślą o maksymalnej prostocie użytkowania. Użytkownicy mogą dodać numer do swoich kontaktów i dzwonić do ChatGPT tak, jak do zwykłego rozmówcy. Jednak równolegle z usługą telefoniczną OpenAI wprowadza możliwość komunikacji z ChatGPT poprzez WhatsApp. I tutaj najważniejsza informacja: 1-800-ChatGPT przez WhatsApp jest dostępna dla każdego, bez względu na położenie geograficzne. Opcja ta ma zasięg globalny w przeciwieństwie do usługi telefonicznej, która początkowo jest dostępna tylko w Stanach Zjednoczonych.

Komunikacja przez WhatsApp obecnie ogranicza się do wiadomości tekstowych, ale OpenAI pracuje nad rozszerzeniem funkcjonalności o możliwość wyszukiwania przy użyciu obrazów. Trwają również prace nad integracją z kontami ChatGPT. Głównym celem ma być personalizacja modeli językowych do poszczególnych potrzeb użytkowników.

Chociaż nikt o tym nie mówi na głos, warto wziąć pod uwagę fakt, że decydując się na połączenie WhatsAppa z OpenAI, faktycznie decydujemy się na udostępnienie wielu potencjalnie wrażliwych danych. Jeśli nie chcemy, aby sztuczna inteligencja zyskiwała dostęp do preferencji i historii zgromadzonych w obrębie WhatsApp, warto dwa razy zastanowić się przed taką integracją.

Głosowy ChatGPT w pigułce

Komunikacja głosowa ChatGPT jest obecnie bardzo ograniczona. Na główne ograniczenia 1-800-ChatGPT składają się:

  • limit 15 minut darmowych rozmów miesięcznie na jeden numer telefonu,
  • dostępność usługi telefonicznej tylko na terenie USA,
  • nieograniczony terytorialnie zakres użytkowania przez WhatsApp w formie wiadomości tekstowych,
  • brak możliwości wyszukiwania obrazów przez WhatsApp,
  • ograniczone opcje personalizacji bez konta ChatGPT,
  • wykorzystanie uproszczonej wersji modelu językowego (ChatGPT 4.0 Mini).

Ograniczenia te są jednak zupełnie naturalne dla początkowej fazy projektu. Podobnie, jak w przypadku innych usług OpenAI, śmiało można spodziewać się ich stopniowego znoszenia wraz z rozwojem usługi.

Nie pierwszy taki projekt

Wprowadzenie usługi telefonicznej ChatGPT wydaje się być jakimś powiewem świeżości, jeśli chodzi o rozwój sztucznej inteligencji. To w końcu pierwszy, powszechny dostęp do sztucznej inteligencji w formie głosowej. Odmienna forma kontaktu z algorytmami AI też może być bagatelizowana, bo zmienia sposób, w jaki ludzie wchodzą w interakcje z technologią.

Nie jest to jednak zupełnie innowacyjny projekt. Przypomnijmy w tym miejscu inicjatywę Google z 2007 roku – projekt o nazwie GOOG-411 (Google Voice Local Search). Pomysł polegał na stworzeniu ogólnodostępnej platformy głosowej, która podobnie byłaby dostępna przez telefon. GOOG-411 miało oferować wsparcie w wyszukiwaniu informacji w sieci. Projekt Google w praktyce służył jednak przede wszystkim do zbierania próbek głosów użytkowników, aby wykorzystać je do opracowywania technologii rozpoznawania mowy. Etap ten się powiódł i zakończył m.in. powszechną implementacją wyszukiwania głosowego Google.

Otwórz aplikację wyszukiwania Google na smartfonie
Komunikacja telefoniczna 1-800-ChatGPT może podzielić losy wyszukiwania głosowego Google.

Wyszukiwanie głosowe nie zyskało jednak takiej aprobaty użytkowników, jak powszechnie sądzono na etapie wdrażania technologii. Poza pewnymi wyjątkami, np. Australią, w której ta forma znajdowania informacji jest niezwykle popularna, użytkownicy preferują tradycyjne wpisanie zapytania w wyszukiwarkę. Przykład ten można przełożyć na komunikację głosową ChatGPT, która również może podzielić losy wyszukiwania głosowego. Pomijając specjalistyczne zastosowania, m.in. w edukacji, a także potrzebne wsparcie dla osób z niepełnosprawnościami, prowadzenie rozmów z ChatGPT raczej powszechnie nie przyjmie się jako główna forma kontaktu z czatbotem.

Komunikacja głosowa ChatGPT – podsumowanie

Wprowadzenie usługi telefonicznej ChatGPT nie jest rewolucją, ale świadczy o tym, jak sprawnie OpenAI rozszerza katalog swoich usług i zwiększa ich dostępność. Chociaż na ten moment bardzo możliwe jest, że 1-800-ChatGPT podzieli losy wyszukiwania głosowego Google, projekty tego typu długoterminowo mogą prowadzić do fundamentalnych zmian w sposobie, w jaki ludzie komunikują się z technologią. Dostęp głosowy do ChatGPT jest też niezwykle potrzebny dla osób, które z różnych przyczyn nie są stanie korzystać z chatbota w tradycyjny sposób. Tym samym komunikacja głosowa OpenAI stanowi rodzaj demokratyzacji dostępu do sztucznej inteligencji. Co więcej, przyszłość AI nie musi być ograniczona do zaawansowanych urządzeń i aplikacji, bo – jak pokazują materiały OpenAI – połączyć się można także przez stary telefon stacjonarny.

Łatwo wyobrazić sobie pełnowymiarowego, humanoidalnego robota, który mówi językiem ChatGPT. Takie amatorskie projekty już zresztą powstają. Na ten moment jednak rozwój komunikacji głosowej z ChatGPT będzie wyzwaniem, bo zupełnie inaczej prezentuje się dane w formie pisemnej, a inaczej w formie ustnej. Sukces głosowego ChatGPT będzie zależał od zdolności OpenAI do rozwiązania ograniczeń technologicznych przy jednoczesnym zachowaniu maksymalnej prostoty i dostępności.

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *