Google Leaks – gigantyczne wycieki danych Google API. W tle nieuczciwe praktyki

Na dniach w sieci pojawiły się dokumenty techniczne, które mają pochodzić z API Google Search. Wywołały one intensywną debatę w zachodniej społeczności SEO, a niektórzy mówią wprost: Google stosuje nieuczciwe praktyki. Z udostępnionych materiałów możemy się dowiedzieć wielu ciekawych rzeczy, w tym w domniemaniu rzeczywistych czynników rankingowych Google. Jeśli ciekawi Cię, czego Google nam nie mówi i jak naprawdę może działać wyszukiwanie Google Search, koniecznie przeczytaj nasz artykuł do końca!

Google Leaks – oskarżenia o nieuczciwość a publiczne oświadczenia Google

Wycieki dokumentów API z Google Search pod koniec maja wywołały intensywną debatę w społeczności SEO. Niektórzy twierdzą, że ujawniają one nieuczciwość Google, podczas gdy inni apelują o ostrożność w interpretacji informacji. W tym artykule przyglądamy się tym sprzecznym sygnałom, ale przede wszystkim analizujemy potencjalne implikacje dla SEO.

Przez lata Google utrzymywało, że sygnały rankingowe, takie jak dane o kliknięciach i metryki zaangażowania użytkowników, nie są bezpośrednio wykorzystywane w algorytmach wyszukiwania. Na temat czynników rankingowych powstało tysiące domysłów, ale żadne z nich nie ma faktycznego potwierdzenia. Wiadomo, że na pewno możemy mówić o czynnikach związanych z zaangażowaniem użytkowników, ale już kwestie dotyczące jakości treści czy aspektów technicznych (wiele stron, których czas ładowania wynosi 10 sek., jest w TOP10 dzięki dużemu zainteresowaniu użytkowników) nie są udowodnione. W oświadczeniach i dokumentach przeznaczonych dla webmasterów Google podkreślało wielokrotnie znaczenie trafności, jakości i doświadczenia użytkownika, zaprzeczając użyciu takich metryk jak CTR (click-through rate) czy wskaźnik odrzuceń.

Pochodzenie i autentyczność wycieku danych

Erfan Azimi, CEO agencji EA Eagle Digital, twierdzi, że zdobył dokumenty API i udostępnił je Randowi Fishkinowi i Mike’owi Kingowi. Azimi twierdzi, że rozmawiał z byłymi pracownikami Google Search, którzy potwierdzili autentyczność informacji, ale odmówili wystąpienia publicznego ze względu na wrażliwość sytuacji i możliwe konsekwencje prawne. Kilku byłych pracowników Google, którzy przejrzeli dokumenty, stwierdziło, że wydają się one być autentyczne.

Na przestrzeni lat nie brakowało podobnych przecieków. Wśród nich były również informacje nieprawdziwe, udające rzeczywiste przecieki. Liczne potwierdzenia różnych osób co do autentyczności najnowszego przecieku danych API sprawiają, że tym razem do sprawy powinno się podejść na poważnie. Google wciąż nie odniósł się w ogóle do przecieku i możliwe, że właśnie taką strategię obierze.

Wielu w społeczności SEO od dawna podejrzewało, że publiczne oświadczenia Google nie opowiadają całej prawdy. Wycieki API tylko pogłębiły te podejrzenia. Fishkin i King twierdzą, że jeśli informacje są prawdziwe, mogą one mieć znaczące implikacje dla strategii SEO i optymalizacji witryn.

Sekretna klasyfikacja kliknięć – Google analizuje kliknięCIA dokładniej, niż sądzono

Najnowsze wycieki dokumentacji API wskazują na coś innego, potwierdzając, że Google mogło wprowadzać w błąd. Przecieki zawierają odniesienia do takich terminów, jak good clicks, bad clicks, last longest clicks. Nazewnictwo sugeruje, że Google analizuje bardziej szczegółowo rodzaje kliknięć i wejść na stronę, niż można było dotąd sądzić. Można je odczytywać następująco:

  • good clicks – kliknięcia uznawane za pozytywne, czyli te, które prowadzą do dłuższego przebywania użytkownika na stronie, co sugeruje, że treść była trafna i wartościowa,
  • bad clicks – kliknięcia uznawane za negatywne, gdy użytkownik szybko wraca do wyników wyszukiwania, co sugeruje, że strona nie spełniła oczekiwań,
  • last longest clicks – ostatnie kliknięcia użytkownika, które prowadziły do najdłuższego czasu spędzonego na stronie, co może być wskaźnikiem wysokiej jakości treści.

Dane te miały być wykorzystywane przez analitykę Google w celu lepszego dopasowania wyników wyszukiwania do intencji użytkowników. Mogły też pośrednio lub bezpośrednio wpływać na organizację wyników wyszukiwania na poszczególne zapytania.

Zbliżone zdjęcie podekscytowanego, zabawnego biznesmena wciskającego klawisz na klawiaturze
Z wycieku wiemy, że Google wyróżnia trzy rodzaje kliknięć użytkowników. W dokumentacji technicznej Google nie dzieli się takimi informacjami.

Wyniki wyszukiwania kształtowane przez zachowania użytkowników w przeglądarce

W przeciekach pojawiają się również wzmianki o zastosowaniu systemów takich jak Navboost i Glue. Skróty te najprawdopodobniej odnoszą się do dwóch systemów Google:

  • Google Navboost – to prawdopodobnie funkcja nawigacyjna Google Maps, która odpowiada za nawigację, wyszukiwanie miejsc, planowanie tras itp. „Navboost” może być nazwą funkcji lub usprawnienia w Google Maps, które pomaga użytkownikom w bardziej efektywnej nawigacji.
  • Google Glue – w dokumentach, które wyciekły, sformułowanie “glue” pojawia się w kontekście rozwiązań chmurowych. Prawdopodobnie chodzi o usługę Google Cloud Data Fusion, która w wewnętrznym sloganie pracowników Google bywa określana właśnie jako “glue”. Data Fusion odpowiada za funkcje integracji danych w chmurze Google i umożliwia łatwe przekształcanie, integrację i przetwarzanie danych z różnych źródeł w celu analizy lub wdrażania poszczególnych aplikacji.

Powyższe elementy zaskakują, ponieważ udowadniają, jak bardzo wyszukiwarka Google Search jest powiązana z całym ekosystemem produktów Google.  Dokumenty sugerują, że sposób zachowania i kliknięcia użytkowników w przeglądarce Chrome są wykorzystywane do wpływania na wyniki wyszukiwania. Stoi to w całkowitej sprzeczności z wcześniejszymi oświadczeniami Google, zgodnie z którymi dane z Chrome miały nie być wykorzystywane w żadnych mechanizmach wyszukiwania organicznego (Google przyznawał się za to do używania tych danych w zakresie Google Ads).

Gruntowna personalizacja bez wiedzy użytkownika

Dokumenty API mają potwierdzać niebezpieczną dla Google tezę, jakoby firma miała dokonywać daleko idących zmian na podstawie analizy aktywności użytkowników. Zmiany te miały również obejmować to, jakie strony użytkownik widzi w wynikach wyszukiwania. Jeżeli przeciek jest autentyczny, to pierwszy taki przypadek, który udowadnia, że SEO ma niewielki wpływ na to, czy dotrzemy do odbiorcy docelowego.

Najważniejsze wnioski z analizy wyciekłych materiałów Google API:

  • Navboost i wykorzystanie kliknięć, CTR, długości sesji i danych użytkowników Chrome jako kluczowych sygnałów rankingowych,
  • Google posiada skumulowane wskaźniki SiteAuthority, które mogą zawierać nawet 14 000 parametrów optymalizacyjnych,
  • stosowanie bezpiecznych list wrażliwych tematów, takich jak COVID-19, wybory polityczne i podróże,
  • wykorzystywanie niejawnych opinii i ocen Quality Raters w systemach rankingowych,
  • ocenianie linków pod względem rankingowym na podstawie sposobu i rodzaju kliknięć użytkowników.

Ponadto analitycy wskazują, że z udostępnionych informacji wynika, że klasyczne czynniki rankingowe mają mniejsze znaczenie, niż powszechnie się im przypisuje. Dotyczy to przede wszystkim takich elementów, jak PageRank i tekst anchora. Czynniki te mają być znacznie mniej istotne od parametrów związanych z preferencjami użytkownika.

grafika, postać z logiem Google stojąca za mężczyzną spożywającym posiłek i wskazująca mu coś palcem
Z przecieku wiemy, że Google rejestruje i wykorzystuje znacznie więcej informacji o zachowaniach użytkowników, niż deklaruje w dokumentacji.

Pytania bez odpowiedzi

Poszczególne wzmianki w dokumentacji API nie oznaczają, że wymienione systemy są faktycznie stosowane w generowaniu wyników wyszukiwania. Inni eksperci branżowi nawołują do ostrożności przy interpretacji wycieków. Zwracają uwagę, że Google może używać tych informacji do celów testowych lub stosować je tylko do określonych pionów wyszukiwania, a nie jako aktywne sygnały rankingowe. Na podstawie dostępnych materiałów nie można potwierdzić, ani zaprzeczyć, że dokumenty dotyczą programów testowych i eksperymentalnych.

Jeżeli jednak zakładać, że mamy do czynienia z pełnoprawnym wyciekiem dotyczącym podstawowych systemów rankingowych Google, to jest się czego bać. Zauważmy, że mamy do czynienia z wyciekiem bardzo krótkiego dokumentu z Google API. Mimo to kontrowersyjnych informacji nie brakuje. Pytanie, co jeszcze wynikałoby z pełnych raportów wewnętrznych Google?

Potencjalne implikacje dla strategii SEO

Czy najnowsze Google Leaks powinno wymuszać na nas zmianę zachowań i utartych schematów pracy związanych z SEO? Jeśli założymy, że informacje te są wiarygodne, to z pewnością tak! Możemy wyróżnić 3 obszary, w obrębie których powinniśmy być szczególnie czujni.

Metryki zaangażowania użytkowników

Jeśli faktycznie dane o kliknięciach i metryki zaangażowania użytkowników są bezpośrednimi czynnikami rankingowymi, to konieczne jest położenie większego nacisku na optymalizację tych metryk. Trzeba więc zwrócić uwagę na wiele “miękkich” parametrów, które nie mają przełożenia technicznego, ale mogą prowadzić np. do wyższego współczynnika konwersji, klikalności itd. Przykładem może być tworzenie atrakcyjnych tytułów i opisów meta, aby zwiększyć CTR, zapewnienie szybkiego ładowania stron i intuicyjnej nawigacji, aby zmniejszyć wskaźnik odrzuceń i zwiększyć średni czas pozostawania użytkownika na stronie.

Sposoby linkowania

Wycieki danych z Google API zawiera informacje na temat sposobu traktowania różnych typów linków i ich wpływu na rankingi wyszukiwania. Jeśli informacje są prawdziwe, rodzaj linkowania może wpływać na pozycjonowanie bardziej, niż dotąd sądzono. Przede wszystkim linki, które generują rzeczywiste kliknięcia, mogą mieć większe znaczenie od tych odnośników, które są są rzadko wybierane na stronach docelowych. W praktyce więc, w zakresie strategii link building, może lepiej częściej postawić na jakość. Zamiast kupować artykuły blogowe na stronach zrobionych pod pozycjonowanie można skupić się na tych portalach, na których artykuły są faktycznie często czytane, co zwiększy szanse na wyższy współczynnik klikalności.

Budowanie marki

Z dokumentów wynika, że Google wykorzystuje sygnały związane z marką jako czynniki rankingowe. Może to oznaczać, że strategie SEO będą musiały bardziej koncentrować się na budowaniu świadomości marki i autorytetu zarówno w kanałach online, jak i offline. Budowanie marki w przestrzeni wirtualnej, a także całej otoczki social media, może być dobrym pomysłem.

Duże trójwymiarowe logo Google obok którego przechodzi kobieta
Google Leaks udowadniają, że chyba czas wrócić do dyskusji sprzed lat pt. “Google: Don’t Be Evil”.

Nowa odsłona Google Leaks – podsumowanie

Najnowsze wycieki dokumentacji API Google wywołały burzę nie tylko wśród społeczności SEO, użytkowników, ale również ekspertów. Chociaż nie ma pewności co do autentyczności ujawnionych dokumentów API, wiele wskazuje na to, że rzeczywiście mamy do czynienia z prawdziwymi informacjami. A te są nieco przerażające. Kluczowe wnioski to:

  1. Google pobiera informacje z różnych swoich produktów i usług, w tym z Google Chrome. Przekładają się one nie tylko na Google Ads, ale również na wyniki wyszukiwania.
  2. Wyniki wyszukiwania układane są nie tylko ze względu na parametryzację pod kątem czynników rankingowych. W procesie udział biorą dane behawioralne dotyczące poszczególnych użytkowników, dane nawigacyjne, i niejawne opinie i oceny Quality Raters.
  3. Google wyróżnia trzy odrębne rodzaje kliknięć użytkowników: good cliks, bad clicks i last longest clicks.
  4. Czynniki rankingowe cały czas ewoluują. Największe znaczenie mają czynniki oparte na zachowaniach użytkowników w przeciwieństwie do mniej istotnych czynników twardych (np. PageRank).

Najogólniejszym przesłaniem na podstawie tego materiału powinno być chyba wskazanie, że nie należy zbytnio przejmować się pozycją w SERP. Zależy ona po prostu od zbyt wielu źródeł arbitralnych. Najlepszą strategią będzie kontynuowanie prac, priorytetyzując działania bezpośrednio nastawione na użytkownika.

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *