Według najnowszych przecieków Open AI, studio odpowiedzialne za opracowanie ChatGPT, intensywnie pracuje nad stworzeniem nowej wyszukiwarki internetowej. W tle pojawia się temat GPTBota, czyli nowego crawlera od Open AI, który przeszukuje sieć na potrzeby zbierania danych do systemów GPT. Czy nowa wyszukiwarka od Open AI – jeśli pogłoski się potwierdzą – ma jakiekolwiek realne szanse na zaistnienie? Czy jest w stanie rzeczywiście konkurować z takim gigantem, jak Google Search? Bierzemy pod lupę najnowszy projekt giganta sztucznej inteligencji!
Open AI zaczyna prace nad własną wyszukiwarką internetową
Z anonimowych źródeł, do których dotarł Search Engine Land, wynika jednoznacznie, że Open AI, twórcy ChatGPT, pracują już nad nową wyszukiwarką internetową. Projekt ma mieć charakter strategiczny, a zaangażowany w jego konstrukcję jest sam twórca ChatGPT. Studio Open AI ma rozwijać produkt częściowo we współpracy z Microsoft Bing.
ChatGPT to najbardziej zaawansowany moduł konwersatoryjny A.I., który korzysta z doskonale dopracowanego modelu LLM i oryginalnej architektury Transformer. Premiera ChatGPT w ogólnodostępnej wersji 3.0 miała miejsce pod koniec 2022 roku. Od tego momentu obserwujemy dynamiczne zmiany zarówno w zakresie rozwoju sztucznej inteligencji i technologii pokrewnych, jak i na płaszczyźnie np. rynku pracy. Już wcześniej wiele mówiło się o tym, że mając dostęp do tak przyszłościowej technologii Open AI może skalować swoją działalność na inne dziedziny. Jedną z nich jest między innymi branża wyszukiwarek.
Poszerzona współpraca z Microsoft i dobre perspektywy na przyszłość
Nie wiemy, czy przecieki, które się pojawiły, faktycznie są wiarygodne, ale ich prawdziwość wydaje się zupełnie zdroworozsądkowa. Trzeba wziąć pod uwagę to, że użytkownicy ChatGPT Plus mogą również korzystania z przeglądania sieci z Microsoft Bing. Idąc dalej, Microsoft Bing wykorzystuje GPT-4 od OpenAI w odpowiednio dostosowanej formy do potrzeb wyszukiwania. Z kolei w sierpniu 2023 r. informowaliśmy o tym, że Open AI posiada własnego crawlera – GPTBota. Wszystkie te informacje zaczynają tworzyć coraz wyraźniejszą całość.
Wyszukiwarka internetowa od Open AI może być strzałem w dziesiątkę. Już teraz, gdy projekt nie został oficjalnie ogłoszony, wiele faktów przemawia na jego korzyść. Open AI stworzyło produkt w postaci ChatGPT, który stał się popularny na cały świat, a spółka jest na ustach wszystkich specjalistów z branży i nie tylko. Ważniejsze jest jednak to, że już teraz wielu użytkowników ChatGPT korzysta z narzędzia tak, jak z wyszukiwarki. Co więcej, częstotliwość korzystania z wyszukiwarek tradycyjnych zaczęła spadać na rzecz rozwiązań AI (wpierw Chat GPT, później Google Bard / Gemini, Microsoft Copilot). Jeśli OpenAI rzeczywiście opracuje własną wyszukiwarkę internetową, pojawią się pytania, czy taka wyszukiwarka faktycznie będzie źródłem jakiegokolwiek znaczącego ruchu organicznego i wartości. Może jednak wiązać się z dużą popularnością i – przynajmniej w początkowej fazie – sporym sukcesie.
Crawler GPTBot
Latem 2023 r. Open AI informowało o zbudowaniu własnej sieci crawlerów o nazwie GPTBot. Narzędzia mają być wykorzystywane na potrzeby modelu GPT w celu przeglądania zasobów sieciowych i wyszukiwania informacji. Crawlery mają nie być skoncentrowane na standardowych wartościach stron internetowych związanych z ich dostępnością czy optymalizacją, ale bardziej na wiedzy, którą są w stanie zaczerpnąć z danego źródła. Pobierana w ten sposób wiedza ma być dostarczana do najnowszych wersji GPT, a także wykorzystywana po selekcjonowaniu jako materiały szkoleniowe.
Właściciele stron mogą w prosty sposób zablokować dostęp do strony wyłącznie dla crawlera GPT. Wystarczy zastosować poniższą komendę w robots.txt:
User-agent: GPTBot
Disallow: /
Można również zdecydować się tylko na częściowe udostępnienie zasobów witryny crawlerowi Open AI. W tym celu można posłużyć się poniższą komendą (w miejscach katalogu wskazuje się obszary udostępniane i nieudostępniane):
User-agent: GPTBot
Allow: /katalog-1/
Disallow: /katalog-2/
Open AI opublikowało również zakresy IP, które używa GPTBot:
52.230.152.0/24
52.233.106.0/24
Początkowo wymieniony był tylko jeden adres, obecnie na stronie widzimy dwa adresy IP. Śmiało można zakładać, że z czasem pojawi się ich więcej.
Pojawienie się crawlera budzi kontrowersje, bo wciąż nie jest znany dokładny sposób zarządzania pobranymi danymi. Rodzą się pytania związane z tematem poszanowania praw autorskich. Coraz więcej państw wprowadza nowelizacje właściwych praw autorskich w związku z pojawiającymi się nadużyciami treści wygenerowanej przez sztuczną inteligencję. Bez względu na to opracowanie i wypuszczenie crawlera GPTBot słusznie zwiastowało dalsze prace nad nowymi rozwiązaniami, takimi jak wyszukiwarka internetowa, co dziś się potwierdza.
Czy Open AI może stanowić zagrożenie dla Google?
Wyszukiwarka od Open AI na starcie ma pewną przewagę technologiczną. Podczas gdy konkurencja dopiero opracowuje własne modele językowe A.I. (np. Google) bądź korzysta z cudzych modeli (częściowo Microsoft), Open AI może wejść na ten rynek z własnym, niebagatelnym zasobem wiedzy. Pozytywnie może to przekładać się na to na budowanie przewagi konkurencyjnej, jednak tylko w wymiarze sztucznej inteligencji. Można więc zakładać, że jeśli Open AI faktycznie pracuje nad własną wyszukiwarką, będzie ona zupełnie inna od tych, które już znamy. Możliwe, że prezentacja wyników wyszukiwania, tj. stron internetowych, będzie drugo- bądź trzeciorzędnym priorytetem narzędzia. Na tym polu bowiem Open AI nie zbyt wiele doświadczenia, więc może skupić się na tym, co zna najlepiej.
Wspominaliśmy także o aspektach medialnych, które są nie do przecenienia w sytuacji, kiedy o studiu Open AI będzie się pisało w podręcznikach do historii (takie zapowiedzi już się pojawiły w Stanach Zjednoczonych i Kanadzie). Nowa wyszukiwarka od razu stałaby się popularna, dzięki czemu na starcie miałaby łatwiej od innych projektów niezależnych, które powstawały przez ostatnią dekadę.
Powstaje jednak pytanie, czy OpenAI może opracować wyszukiwarkę, która faktycznie rywalizuje z Google? Wydaje się, że odpowiedź będzie jednak negatywna. Warto spojrzeć w tym miejscu na innych graczy. Microsoft, jedna z firm o najwyższym poziomie kapitalizacji rynkowej w USA, nie zdołała zrobić postępów w porównaniu z Google przez dwie dekady. W tym czasie Microsoft (podobnie zresztą jak Google) wykupił i przejął tysiące innych firm, które stanowiłyby ewentualną konkurencję. Wydano miliony dolarów na inwestycje w AI, ale ostatecznie pomimo ciekawego projektu w postaci Copilota Microsoft postawił na ścisłą współpracę z Open AI.
W większości państw Google to naturalny wybór. To swego rodzaju “nawyk”, jak sam oficjalnie dostrzegł CEO Microsoftu, Satya Nadella. Na przestrzeni ostatnich lat widzieliśmy już wiele innych projektów, które miały zepchnąć Google z tronu (np. Blekko, Neeva) – wciąż się to nie udało. Pomimo tego, że ChatGPT jest najpopularniejszym narzędziem konwersatoryjnym A.I., jeśli sumarycznie porównać liczbę wizyt, wciąż nie może równać się z Google. Google otrzymał szacowane 84,2 miliarda wizyt, podczas gdy ChatGPT otrzymał szacowane 1,6 miliarda w grudniu.
Nowa wyszukiwarka od Open AI – podsumowanie
Open AI ma ogromny potencjał skalowania biznesu, ale wejście na rynek wyszukiwarek wcale nie jest oczywistym wyborem. Opublikowane przecieki mają potwierdzać, że już teraz twórcy ChatGPT pracują nad nową wyszukiwarką. Wcześniejsza premiera crawlera GPTBot w tym kontekście była dobrze odczytywana jako początek rozszerzania działalności amerykańskiego studia.
Nie mam jednak żadnych danych na temat tego, jak miałby wyglądać produkt Open AI. Ze względu na olbrzymią konkurencję w tym segmencie (Google, Bing), jedyna szansa na przekucie popularności w pożądane rezultaty tkwi w jeszcze większej innowacyjności.
Open AI w kontekście rozwoju sztucznej inteligencje i jej potencjalnego wpływu na sposób, w jaki korzystamy z zasobów internetowych, ma potencjał do kształtowania nowych trendów i tworzenia narzędzi, które może na pierwszy rzut oka w ogóle nie będą przypominały tradycyjnych wyszukiwarek, takich jak Google Search. Niezależnie od rezultatów, warto śledzić rozwój tej inicjatywy, bo na pewno będzie ona również wpływać na rozwój technologii sztucznej inteligencji w ogóle.