Nowe rozwiązania związane z rozwojem sztucznej inteligencji dotykają praktycznie całą branżę, nie tylko najbardziej znanych gigantów technologicznych. Brave Search, autorska wyszukiwarka internetowa Brave, twórców przeglądarki o tej samej nazwie, właśnie zyskała nowe, ciekawe funkcje. Mowa o “Answer with A.I.” – funkcji wyszukiwarki, która pokazuje odpowiedź na prompt wygenerowaną w czasie rzeczywistym przez model językowy. Przyglądamy się, czy pomysł Brave może być argumentem przysparzającym im większej popularności i jak działa najnowsze udogodnienie!
Brave Search wprowadza moduł sztucznej inteligencji
Brave właśnie ogłosiło swoją nową wyszukiwarkę Brave Search wzbogaconą o nową funkcję opartą na sztucznej inteligencji. Mowa o module o nazwie “Answer with AI”, który umożliwia wygenerowanie odpowiedzi przy użyciu modelu językowego sztucznej inteligencji w czasie rzeczywistym. Czy nowa wyszukiwarka zabierze kawałek tortu gigantom, takim jak Microsoft Bing i Google Search?
Brave to wyszukiwarka, ale także przeglądarka internetowa, która oficjalnie ma mieć jeden nadrzędny cel: poszanowanie prywatności użytkowników. Współpracuje ona z własnym indeksem wyszukiwania zawierającym miliardy stron internetowych. Obecna wyszukiwarka Brave obsługuje już 10 miliardów zapytań rocznie, co czyni ją jedną z największych wyszukiwarek opartych na sztucznej inteligencji w sieci.
Wielu specjalistów z branży marketingu wyszukiwania i e-commerce wyrażało obawy co do przyszłości rozwoju wyszukiwarek opartych na sztucznej inteligencji. Nowe rozwiązanie od Brave nadal prezentuje linki w klasycznej formie, domyślnie nie odpowiada na zapytania komercyjne czy transakcyjne za pomocą sztucznej inteligencji, co powinno być dobrą wiadomością dla specjalistów SEO i wszelkich sceptyków.
Na czym polega “Answer with AI” Brave Search?
Opcja “Answer with AI” dostępna jest tylko poprzez kliknięcie, czyli podobnie, jak “Search with Google” czy “I’m feeling lucky”. Brave Search nie ma usługi automatycznego generowania wyników przy pomocy A.I. Samo skorzystanie z tej opcji również nie zabiera dostępu do standardowej listy SERP. Po wpisaniu frazy i kliknięciu na ikonę “Answer with AI” w górnym bloku pokażą się informacje wygenerowane przez sztuczną inteligencję. Jeżeli wpisana została nazwa firmy albo imię i nazwisko jakiejś osoby, model wygeneruje podstawowe informacje, dane kontaktowe, ewentualnie wzbogaci je o pole działalności, wyróżnienia, nagrody itd.
Na uwagę zasługuje sposób prezentowania wyników. Brave Search jest pod tym względem nieco bardziej minimalistyczną wyszukiwarką niż Google i znacznie bardziej intuicyjną względem Microsoft Bing. Nawet po skorzystaniu opcji wygenerowania informacji przez sztuczną inteligencję wszystkie wyniki wyszukiwania prezentowane są schludnie. Samo okno informacji A.I. nie zaburza sposobu poruszania się po wynikach wyszukiwania. Zawarte linki również umożliwiają szybsze znalezienie informacji. Całość wygląda dość prosto, skromnie, ale jednocześnie zapewnia efektywną i satysfakcjonującą pracę.
Brave Search z A.I. ma bazować wyłącznie na źródłach własnych
Search Engine Journal rozmawiał z Josepem M. Pujolem, szefem działu wyszukiwania Brave, który odpowiedział na pytania dotyczące indeksu wyszukiwania, sposobu działania z sztuczną inteligencją i co najważniejsze, podzielił się tym, co specjaliści SEO i właściciele firm powinni wiedzieć, aby poprawić pozycjonowanie.
Pomimo tego, że Brave jest niewspółmiernie mniejszą spółką względem Microsoftu czy Alphabetu, zespołowi udało się opracować naprawdę nowoczesne techniki generowania treści. W przeciwieństwie do innych rozwiązań wyszukiwania opartych na sztucznej inteligencji silnik wyszukiwania A.I. w Brave Search funkcjonuje wyłącznie na podstawie własnego indeksu wyszukiwania zaindeksowanych i sklasyfikowanych stron internetowych. Cała technologia bazowa, począwszy od indeksu wyszukiwania, poprzez duże modele językowe (LLM), na technologii Retrieval Augmented Generation (RAG) skończywszy, została opracowana niezależnie przez zespół Brave. Twórcy podkreślają, że jest to szczególnie istotne ze względu na kwestię zachowania prywatności wyszukiwania użytkowników. Żadne wpisywane promptu nie mają być przekazywane do podmiotów trzecich.
Sam silnik wyszukiwania jest w pełni rozwijany wewnętrznie. Josep Pujol stwierdza, że „Brave ma dostęp w czasie rzeczywistym do wszystkich własnych indeksów, które obejmują ponad 20 miliardów stron. Jesteśmy w stanie wyciągać dowolne informacje w czasie rzeczywistym (schematy, tabele, fragmenty, opisy itp.). Ponadto, bardzo szczegółowo dobieramy dane, od całych akapitów lub tekstów na stronie po pojedyncze zdania lub wiersze w tabeli”.
Brave w oficjalnych komunikatach zaznacza, że skupia się na selekcji i klasyfikacji danych, a nie ich odzyskiwaniu. Silnik ma być pozbawiony tych elementów, które miałyby być krytyczne dla zachowania prywatności użytkowników. Brave Search, wraz z nową opcją “Answer with AI”, miało otrzymać też ulepszone systemy klasyfikowania stron i ich treści, w tym również analizy takich elementów, jak oceny, popularność, recenzje itd.
Technologia wyszukiwania z A.I. – RAG i LLM
Sposób działania Brave Search bazuje na szerokim indeksie wyszukiwania oraz współpracy z autorskimi, dużymi modelami językowymi (LLM). Istotną rolę odgrywa też technologia Retrieval Augmented Generation (RAG), która zapewnia powtarzalność i unikalność wyników.
Technologia RAG to jeden z najszybciej rozwijających się klastrów związanych z technologią sztucznej inteligencji. Retrieval Augmented Generation łączy ze sobą dwa modele: model przetrzymujący (retriever) i model generujący (generator). Pierwszy z tych modeli odpowiada za wyszukiwanie istotnych dokumentów lub informacji z dużych baz danych, np. indeksów wyszukiwarek, ale nie tylko. Drugi model, generator, wykorzystuje zebrane i skompilowane informacje do generowania odpowiedzi. Technologia jest wykorzystywana w celu poprawy dokładności i trafności wyników wyszukiwania, wykorzystując zarówno moc sztucznej inteligencji, jak i ogromną ilość informacji dostępnych w sieci.
Brave potwierdza stosowanie technologii RAG dla funkcji A.I. w Brave Search. Pujol przyznaje, że “już wcześniej używaliśmy tej technologii w naszej poprzedniej funkcji Summarizer, wydanej w marcu 2023 roku. Jednakże w tej nowej funkcji rozszerzamy zarówno ilość, jak i jakość danych używanych w treści pytania”.
Brave Search ma korzystać także z dużych modeli językowych opartych na AWS p4 z VLLM. Wykorzystywana jest kombinacja Mixtral 8x7B i Mistral 7B jako głównego modelu LLM. Brave ma korzystać także z wielu niestandardowych modeli transformatorowych do zadań pomocniczych. To między innymi weryfikacja i dopasowanie semantyczne odpowiedzi do zdekodowanego promptu, selekcja danych, fragmentaryzacja tekstu, analiza zależności między różnymi wariantami danych, m.in. danymi strukturalnymi z fragmentów rozszerzonych, tabel, schematów itd. Ze względu na wymagania dotyczące maksymalnych opóźnień generowania wyników wyszukiwania, które dla Brave mają wynosić 20 ms, używane modele są znacznie mniejsze. Pomimo tego, przynajmniej w trakcie testowania, nie widać żadnego negatywnego przełożenia się tego faktu na jakość generowanych wyników, ani komfort procesu wyszukiwania.
Pujol w wywiadzie z Search Engine Journal dowodzi wysokiej jakości generowanych wyników, pomimo stosowania pewnych uproszczeń, jeżeli chodzi o LLM. Przykładowo, zapytanie „prezydenci Francji według partii” ma przetwarzać 220 Kb surowych danych, w tym 462 wierszy wybranych z 47 tabel i 7 schematów. Rozmiar pytania wynosi około 6500 tokenów, a ostateczna odpowiedź to… zaledwie 876 bajtów. Podsumowując, dzięki „Answer with AI” możliwe jest generowanie wyników przy zawężeniu poziomu analizy z pełnych 20 miliardów stron do finalnie zaledwie kilku tysięcy tokenów.
Wyszukiwanie lokalne w Brave Search
W rozmowie poświęcono też dłuższy czas tematyce wyszukiwania lokalnego. Nowa wyszukiwarka Brave ma prezentować wyniki lokalne w oparciu o standardowe funkcje informacyjne. Korzystając zaś z opcji “Answer with A.I.”, sztuczna inteligencja ma czerpać nie tylko z wyników lokalnych, ale także z ogólnodostępnych baz zewnętrznych, np. baz firm, które zostały inkorporowane do szkolenia modelu. Indeks wyszukiwania Brave posiada ponad miliard schematów opartych na lokalizacji, z których możemy wyodrębnić ponad 100 milionów firm i innych punktów zainteresowania.
Temat ten rzuca też więcej światła na to, jak w ogóle ma działać funkcja A.I. w Brave. To przede wszystkim konglomerat różnych funkcji, takich jak standardowe wyszukiwanie, LLM, specjalistyczne modele uczenia maszynowego, RAG, usługi pozyskiwania, klasyfikowania, czyszczenia, łączenia i reprezentowania informacji. Wszystko to bazuje oczywiście na dużych zbiorach danych, które mają wykraczać poza dane wchodzące w skład autorskich indeksów wyszukiwarki Brave Search.
Reasumując, czasami końcowy rezultat wydaje się być bardzo pod wpływem LLM (gdy odpowiedź na pytanie użytkownika jest pojedynczym punktem zainteresowania), a innym razem ich rola jest bardziej subtelna. Dla wyszukiwania lokalnego specjaliści z Brave mieli ponoć opracować inherentne taksonomie sprawdzające się dla zupełnie różnych środowisk i tematów po to, aby zawsze prezentować najważniejsze informacje.
Brave Search a dane strukturyzowane
Brave przechodzi również zmiany w zakresie czynników rankingowych. Ze względu na to, że Brave Search ma korzystać z własnych indeksów opartych na niezależnej metodologii, to, co sprawdza się w pozycjonowaniu w Google nie musi sprawdzać się w pozycjonowaniu w Brave (i vice versa). Jedno z pytań zadanych przez Search Engine Land dotyczyło tego, czy korzystanie ze strukturyzowanych danych schema.org jest przydatne dla poprawy pozycji strony w Brave.
Wyszukiwarka ma przykładać szczególną uwagę do danych ustrukturyzowanych i wszystkich elementów stron internetowych, które pomagają w hierarchii i organizacji treści. Pujol uważa, że najlepiej mieć strukturyzowane dane dotyczące własnej działalności. Dane strukturalne mają być szczególnie istotne dla Brave w wyszukiwaniu z A.I. Mają one pozwalać na budowanie holistycznych, kompleksowych kontekstów w trakcie generowania odpowiedzi. Im bardziej kompleksowe będą te schematy, tym bardziej precyzyjna będzie odpowiedź generowana przez model A.I.
Kontrowersje związane z Brave
Brave jest jednak kontrowersyjnym projektem. Najgłośniejszą propozycją jest płacenie użytkownikom za oglądanie reklam. Brave Rewards miały być wypłacany na portfel kryptowalutowy w walucie BAT (Basic Attention Token). Wielu użytkowników narzeka jednak na to, że wypłaty nie są realizowane. Co więcej, finalizacja wypłaty wymaga podawania szczegółowych danych wrażliwych.
Na różnego rodzaju platformach dyskusyjnych, w tym Reddit, można spotkać się z wieloma pozytywnymi opiniami na temat przeglądarki Brave. Nie jest jasne jednak, na ile opinie te są autentyczne. Faktem jest, że spółka została raz przyłapana na umieszczaniu w wynikach wyszukiwania linków afiliacyjnych. Chociaż firma oficjalnie przeprosiła za stosowanie nielegalnych praktyk, niesmak pozostał.
Kolejnym aspektem jest integracja z TOR, która budzi wątpliwości w zakresie dostępu do danych i historii przeglądania. Podobnie można powiedzieć o wbudowanym pluginie w postaci portfela kryptowalutowego. Ten ostatni może być jednak wyłączony przez użytkownika ręcznie.
Brave Search wprowadza moduł A.I. – podsumowanie
Brave Search to nie rewolucja. Po Chat GTP – nawet Microsoft Copilot czy Google Gemini – trudno jest już czymkolwiek zaskoczyć. Trzeba jednak z drugiej strony przyznać, że skądinąd dość młody doświadczeniem zespół z Brave wskakuje tym samym na wyższy poziom rozwoju. Są przecież na rynku konkurenci o znacznie większej stopie udziału w rynku, jak i kapitalizacji, np. Duck Duck Go, a z przeglądarek: Mozilla i Opera, a jednak to właśnie Brave stworzył to innowacyjne rozwiązanie.
“Answer with A.I.” jest prostą funkcją, która nie dostarczy nam fajerwerków. Ale niektórym właśnie to może się w niej podobać najbardziej. Mamy bowiem przed sobą porządnie wykonaną opcję wyszukiwania wykorzystującego system RAG, LLM i szerokie pole danych. Nie bawimy się w pisanie śmiesznych promptów, ani w humory i zmienne nastroje modelu, jak w przypadku Microsoft Copilot. Po prostu szukamy. Dostajemy wyniki. Wpisujemy dalej bądź intuicyjnie zaczynamy korzystać z SERP, bo wszystko przecież działa w obrębie wyszukiwarki.
Takie rozwiązanie, zwłaszcza jego prostota, naprawdę ma wiele plusów. Z uwagą przyglądamy się zatem rozwojowi sytuacji. Choć trzeba też pamiętać, że Brave jest przeglądarką specyficzną. Nie każdy użytkownik będzie zadowolony z różnych dodatkowych funkcji, jakie oferuje, włącznie z portfelem krypto i nie każdy będzie skłonny jej zaufać…