Nowy materiał ekspercki na profilu Google Search Central rzuca światło na sposób analizy promptów przez Google Search. Gary Illyes tłumaczy, jakie czynniki wpływają na wybór prezentowanych stron w SERP na podstawie struktury i charakteru promptu. Czy opis ten jednak oddaje w pełni rzeczywistość? W praktyce Google ma bardzo zaawansowany mechanizm odpowiedniości i personalizacji wyników wyszukiwania. Analizujemy cały proces od A do Z, zwracając uwagę na te aspekty, które często są pomijane!

Przetwarzanie promptów w Google Search i sposób oceny treści
W najnowszym odcinku Google Search Central Gary Illyes opisuje proces, który Google stosuje do zrozumienia zapytań wyszukiwania i wyjaśnia, jakie czynniki wpływają na wybór wyświetlanych stron internetowych. Oczywiście najwięcej informacji ma charakter marketingowy. Przez cały materiał powtarzają się takie tezy, jak ta, że celem w wyszukiwaniu jest dostarczanie wyników z stronami internetowymi, które są wysokiej jakości, wiarygodne i odpowiednie. Pominięto całkowicie dopasowania społeczno-demograficzne użytkownika oraz politykę Google Ads. Pomimo tego, jest kilka ciekawych wniosków, które można z materiału wyprowadzić. Poniżej prezentujemy je w takiej kolejności, w jakiej pojawiają się w filmie i analizujemy dalej.

Kategoria odpowiedniości – dopasowanie wyników promptu do użytkownika
Pierwszy wniosek dotyczy sposobu łączenia sposobu odpowiedzi na promptu z informacjami na temat użytkownika. Illyes określa to mianem kategorii odpowiedniości. Odpowiedniość dla użytkownika ma się zupełnie różnić od semantycznego dostosowania. Oznacza personalizację, która może być wynikiem wcześniejszych wyszukiwań, aktualności (np. trendów zainteresowania, klastrów tematycznych użytkownika), geolokalizacji, danych z konta i nie tylko.
Google Search dostosowuje wyniki wyszukiwania w SERP do konkretnego zapytania poprzez wykorzystanie algorytmów personalizacji i analizy promptu. Proces ten obejmuje nie tylko semantyczną analizę słów kluczowych, ale także uwzględnia kontekst zapytania, intencję użytkownika oraz jego wcześniejsze działania w sieci. Google wykorzystuje dane związane z lokalizacją użytkownika, dostosowując wyniki do jego geograficznego położenia. Na przestrzeni lat coraz ważniejszych czynnikiem jest wykorzystywanie danych geolokalizacyjnych, a klasyfikacja promptów jako wyszukiwania lokalnego cały czas się poszerza, o czym pisaliśmy na naszej stronie jesienią.
Oczyszczanie promptu i usuwanie słów blokujących
Pierwszy etap procesu generowania listy wyszukiwania polega na dekodowaniu zapytania użytkownika. W procesie analizy zapytania Google Search wykorzystuje zaawansowane techniki przetwarzania języka naturalnego (NLP) i algorytmy uczenia maszynowego. Po pierwszej dekodyfikacji promptu system identyfikuje kluczowe elementy, takie jak frazy kluczowe, nazwy własne czy pytania użytkownika. Następnie ma miejsce oczyszczanie semantyczne, które na początku polega na identyfikowaniu słów zbytecznych, które nie mają przełożenia na rodzaj wyświetlanych wyników. Illyes podaje tu przykłady z wyszukiwania w języku angielskim.
“Oczyszczanie promptu” polega między innymi na usunięcie tzw. „stop words” (słów blokujących), zidentyfikowanie jednostek, które wymagają zachowania tych słów, jak i rozszerzenie zapytania. Słowa blokujące dla języka angielskiego to m.in.: “and” (używane bez komendy, bez cudzysłowu), “in”, “is”, “on” czy przedimki “a”, “an”, “the”. Wyrazy te mają być usuwane z zapytania, ponieważ występują często i nie dodają nic istotnego do intencji użytkownika. Ogólnie rzecz biorąc, istnieje również praktyczny powód do usuwania słów blokujących – zmniejsza to nadmierną objętość bazy danych, co przekłada się na czas przetwarzania promptu i ogólną szybkość całego procesu wyszukiwania.

Analiza intencji wyszukiwania i rozszerzenie zapytania
Kolejnym krokiem jest wykrywanie intencji wyszukiwania, czyli selekcjonowanie zdekodowanych części promptu w obrębie klastrów tematycznych. Kolokwialnie mówiąc, to ta płaszczyzna, która najbardziej wpływa na to, czy użytkownik zobaczy wyniki, których się spodziewa, czy też jego intencja zostanie zupełnie zignorowana.
Google uwzględnia również kontekst zapytania, na który składają się takie czynniki, jak historyczne wyszukiwania użytkownika, lokalizacja geograficzna czy preferencje językowe. Cały ten proces jest obsługiwany przez rozbudowane systemy klastrów informacyjnych, które automatycznie analizują ogromne ilości danych w czasie rzeczywistym.
Subetapem wchodzącym w skład analizy intencji po zdekodowaniu promptu jest również rozszerzanie zapytania bazowego. To ta część, w której wstępnie przetworzone zapytania są łączone z innymi podobnymi promptami. Służy to między innymi identyfikacji podobieństw; np. fraza „dealer samochodowy” będzie zaklasyfikowana do tej samej grupy semantycznej, co „dealer aut”. Tym samym strona internetowa dotycząca jednego wyniku może być oceniana dla zapytań dotyczących drugiego, nawet jeśli fraza nie występuje na stronie.
Analiza doboru stron do promptu
Gdy zapytanie jest zrozumiane, przetworzone zapytanie jest następnie wysyłane do indeksu w celu oceny. Analiza doboru stron względem przetworzonego zapytania wciąż wykorzystuje m.in.:
- Odpowiedniość dla użytkownika, na którą mają wpływać setki różnych czynników,
- Treści dostępne na stronie,
- Lokalizacja użytkownika, rodzaj i język urządzenia,
- Jakość stron internetowych i witryny,
- Funkcje w zależności od zapytania.
Gary podkreśla, że ranking w dużym stopniu zależy od trafności wyników dla użytkownika, co, choć na pierwszy rzut oka proste, zawiera w sobie nieco inne znaczenie. Jak już wspomnieliśmy, wielu specjalistów SEO skupia się na semantyce, jednakże aspekt trafności dla użytkownika obejmuje kwestie dotyczące wieloznaczności promptów i zróżnicowania kontekstów, które przekraczają granice semantycznej trafności.
Czynniki jakościowe przy generowaniu wyników SERP
Proces generowania listy wyników wyszukiwania obejmuje również drugą stronę, czyli katalog adresów, które mogą być wyświetlone. Spośród puli stron, które pasują do promptu w kategoriach odpowiedniościm oraz pozytywnie przechodzą przez algorytmy związane z personalizacją, znajdują się strony, które wciąż różnią się od siebie wieloma czynnikami. Mówi o tym również Gary Illyes w najnowszym odcinku Google Search Console.
Unikalność stron internetowych ma być nie tylko zwykłym czynnikiem jakościowym, ale czynnikiem rankingowym. Illyes przekonuje, że unikalność nie ma tylko znaczenia dosłownego – nie jest synonimem oryginalności treści. Przyznaje, że z tego powodu śmieszne jest, kiedy agencje oferują usługi pokroju “analiza konkurencji SEO” jako część procesu pozycjonowania, bo przeważnie robione jest to bez projektowania własnej unikalności. W rezultacie staje się to pierwszym krokiem w tworzeniu treści podobnej do tego, co już jest w wynikach wyszukiwania, bazując na przekonaniu, że to jest właśnie to, co zyska aprobatę Google’a.

Jak Google przetwarza zapytania? Podsumowanie
Proces generowania wyników na stronie wyników wyszukiwania przez Google rozpoczyna się od przetwarzania zapytania użytkownika. Na początku prompt zostaje zdekodowany tak, aby był zrozumiały dla algorytmów. Następnie zapytanie jest oczyszczane z ze słów, które nie wnoszą żadnego znaczenia dla wyszukiwania, a mogą rozmywać trafność wyników, np. przedimków w przypadku języka angielskiego. Kolejnym etapem jest analiza semantyczna, która bada znaczenie promptu i próbuje zaklasyfikować go w obręb któregoś z klastrów tematycznych (Google nie publikuje dokładnych informacji na temat tego, jakie są to klastry, jak są skonstruowane i ile ich jest).
Po dekodowaniu i analizie semantycznej następuje rozszerzona analiza intencji użytkownika przy wykorzystaniu metod personalizacyjnych. W tym momencie algorytmy nanoszą na wyszukiwany prompt konteksty ważne dla danego użytkownika, takie jak lokalizacja geograficzna, preferencje językowe dla wyszukiwania i urządzenia, rodzaj urządzenia czy historia wyszukiwania w Google Search (i prawdopodobnie innych platformach należących do Google, np. Youtube).
Google wykorzystuje zaawansowane techniki przetwarzania języka naturalnego (NLP), w tym usuwanie słów blokujących, identyfikację kluczowych elementów i ekspansję zapytań, aby lepiej zrozumieć intencję wyszukiwania. Zidentyfikowane zapytanie jest wysyłane do indeksu, gdzie jest porównywane z ogromną bazą danych stron internetowych, które zostały zindeksowane przez Googlebota. Kluczową kwestią w procesie oceny jest trafność wyników dla użytkownika, która uwzględnia unikalność strony, jednak rozumianą nie tylko w wymiarze semantycznym, a bardziej jako rodzaj oryginalności w porównaniu do innych wyników.
Cały proces od przetwarzania zapytania po generowanie wyników odbywa się w czasie rzeczywistym, przy wykorzystaniu i zaawansowanych algorytmów i operacji na milionach klastrów. Najważniejsze newsy z najnowszego materiału to przede wszystkim potwierdzenie oddzielnego traktowania kategorii unikalności strony dla wyników w SERP oraz arbitralność aktywowanych rodzajów funkcji wyszukiwania. Gary Illyes potwierdził ostatecznie, że są one zależne od zapytania, co oznacza, że różne zapytania wyzwalają różne funkcje wyszukiwarki.