Google kontynuuje porządki w indeksie. Tysiące stron poza wyszukiwarką, na celowniku treści niskiej jakości

W ostatnich dniach widzimy coraz więcej efektów wprowadzanej aktualizacji Core Update. Według najnowszych szacunków Google mogło pozbyć się z sieci nawet 34,2 miliony stron internetowych. Aktualizacja ma charakter stopniowy i cały czas podejmowane są kolejne działania. O ile w pierwszych dniach Google skupiło się najbardziej na stronach manipulujących wskaźnikiem reputacji, o tyle ostatnio coraz głośniej jest o walce z treścią generowaną przez ChatGPT i inne modele językowe. Czy jest się czego bać? Wszystko wskazuje na to, że jak najbardziej.

Google kontynuuje walkę ze spamem w wynikach wyszukiwania

Przez ostatnie miesiące wiele artykułów – w tym nasze – narzekało na brak skutecznych działań ze strony Google. Marcowe aktualizacje Google Core Update w końcu dają powody do tego, aby wierzyć w to, że Google jest w stanie podejmować konkretne kroki. Jak informowaliśmy wcześniej, to pierwsza tego typu aktualizacja typu Core Update, która składa się z szeregu pomniejszych zmian, w tym aktualizacji Helpful Content. Zakończenie wszystkich działań planowanych w ramach marcowego Core Update ma przypadać dopiero na 5 maja 2024 roku.

Już teraz jednak Google wykluczyło z indeksu wyszukiwarki tysiące stron internetowych. Masowo realizowane są działania manualne, które mają polegać na ręcznej weryfikacji jakości stron przez pracowników Google. Biorąc pod uwagę potężną skalę działań, z pewnością wykorzystywane są też jakieś mechanizmy automatyzacji całego procesu.

Strony otrzymują ostrzeżenia, kary, a w najbardziej jednoznacznych przypadkach także natychmiastową deindeksację bez żadnych zapowiedzi. Szczególnie zwalczane są strony stosujące niezgodne praktyki w zakresie link building, manipulowania poziomem reputacji i nadmiernym wykorzystywaniem treści generowanych przez A.I. Poniżej przedstawiamy dokładnie, ile stron udało się usunąć z Google w pierwszych tygodniach aktualizacji i jaki jest wspólny mianownik, który je łączy!

Prawie 2% zaindeksowanych stron już poza Google

Coraz wyraźniej widać, że ostatni Core Update wymierzony jest w strony z niskiej jakości contentem i spamem. Najnowsze analizy pokazują, że na wczesnym etapie aktualizacji z indeksu usunięto ponad 800 stron. Wykluczenia były rozległe, gdyż mowa o stronach składających się często z setek lub tysięcy podstron i subdomen.

Według Iana Nuttalla, czołowej postaci w środowisko SEO, Google podejmuje działania manualne w bezprecedensowej skali. Od samego początku aktualizacji śledził on statusy ponad 49 tysięcy stron internetowych. Po uruchomieniu marcowej aktualizacji Core Update 837 z nich zostało całkowicie usuniętych z indeksu Google. Oznacza to, że Google “pozbyło się” 1,71% stron internetowych z indeksu. Jeśli spróbowalibyśmy ekstrapolować te wyniki na całokształt, szybko okaże się, że mamy do czynienia z armagedonem. Zakładając bardzo ostrożnie za portalem Statista, że w części jawnej sieci jest około 2 miliardy niezależnych stron internetowych, to delikatnie można założyć, że od wprowadzenia aktualizacji z internetu ubyło 34,2 miliony stron internetowych. Takie rezultaty mają oczywiście charakter szacunkowy. Wciąż jednak potencjał obecnych działań musi robić wrażenie, biorąc pod uwagę kontekst wyraźnej bierności Google w przeszłości.

Robot z głową w kształcie kuli, który używa dwóch czerwonych sit do przesiewania kolorowych danych
Google robi masowe porządki w wynikach wyszukiwania.

Google usuwa strony, które nieuczciwie zabierały ruch innym

Na konsekwencje w postaci wykluczenia strony z indeksu Google Search z pewnością mogą liczyć witryny, które w sposób systemowy zabierały ruch konkurencji. Chodzi o spamowe strony internetowe manipulujące wskaźnikami, często z bogatym, choć niskiej jakości profilem backlinkowym. Jednym z czynników wzrostu ich pozycji w wyszukiwarce były znane już strategie link building wpisujące się w black hat seo lub należące do szarej strefy.

Usunięte strony najczęściej miały bardzo rozbudowaną strukturę. Potwierdzają to statystyki. Według analiz Nuttalla przed podjęciem działań manualnych przez Google 837 obserwowanych stron internetowych odpowiadało za ponad 20,7 miliona unikalnych wejść organicznych z wyników wyszukiwania. Szacuje się, że wykluczenie z indeksu spowoduje miesięczne straty w wysokości 446,5 milionów dolarów z tytułu wyświetlanych reklam na stronach objętych działaniami. Straty w takiej wysokości muszą być odczuwalne również dla większych podmiotów, co pokazuje determinację Google, której dawno nie obserwowaliśmy.

Wszystkie usuwane strony z indeksu zawierają treści wygenerowane przez A.I. Przypadek?

Analiza Nuttalla pokrywa się z innym badaniem przeprowadzonym ostatnio przez serwis Originality.ai, który odpowiada za tworzenie programów do detekcji plagiatów, treści generowanych przez A.I. i nie tylko. Obydwie analizy dostarczają nam ciekawych wniosków w zakresie treści generowanych przez sztuczną inteligencję.

Okazuje się, że 100% usuniętych z indeksu stron posiadało treści generowane przez A.I. Aż połowa wszystkich wykluczonych serwisów polegała praktycznie wyłącznie na wpisach generowanych przez modele językowe (stosunek treści człowieka do treści A.I. <10%).

Takie rezultaty unaoczniają nam, że marcowa aktualizacja Google z 2024 roku w dużym stopniu skierowana jest przeciwko stronom, które nadmiernie wykorzystują narzędzia A.I. Mówimy tu o serwisach niezwykle bogatych we wpisy; stronach, których blogi składają się z dziesiątek tysięcy artykułów wygenerowanych przez sztuczną inteligencję. Działania wydają się oczywiste i naturalne, ale przypomnijmy, że to pierwszy raz w historii, kiedy Google otwarcie walczy z treściami A.I. w obrębie Google Search. Obecnie są to jedynie działania manualne, ale możliwe, że Google szykuje także zmiany algorytmiczne.

Blog Johna Muellera usunięty z Google. Easter egg?

Przy okazji na dniach pojawiła się bardziej przyziemna i sensacyjna wiadomość. Blog Johna Muellera, “twarzy” Google, który odpowiada za relacje z otoczeniem, wypadł z indeksu Google Search. Wścibscy członkowie społeczności zweryfikowali tę informację przypadkowo. W społeczności rozgorzała dyskusja, bo to, że strona internetowa Johna Muellera już nie jest widoczna w wynikach wyszukiwania Google, nie zdarza się często. Czy ta sytuacja ma jakikolwiek związek z przeprowadzaną aktualizacją Core Update?

Wydaje się, że oficjalna strona Johna Muellera została wykluczona z indeksu i całkowicie usunięta z Google. Jej stan można sprawdzić najprostszą metodą, czyli przy zastosowaniu komendy site: site:johnmu.com. Po wpisaniu takiego promptu w Google Search wyszukiwarka nie zwróci żadnych wyników.

Google nie widzi w indeksie oficjalnej strony Johna Muellera.
Google nie widzi w indeksie oficjalnej strony Johna Muellera.

Fakt, że ta prosta, ale ikoniczna już strona internetowa nie wyświetla się w wynikach wyszukiwania, stał się przyczynkiem do powstania wielu teorii spiskowych. John Mueller to jedna z najbardziej rozpoznawalnych osobistości Google Search w internecie, regularnia pojawiająca się także w podcastach i krótkich filmach instruktażowych na oficjalnym profilu Google Search Console na Youtube. Biorąc to wszystko pod uwagę, faktycznie dziwne wydaje się całkowite zniknięcie całej strony johnmu z sieci Google.

Krótki dochodzenie społeczności SEO pokazuje jednak, że obecny stan jest raczej zupełnie niezwiązany z marcową aktualizacją. Strona Johna mogła nie znajdować się w indeksie już od kilku miesięcy i prawdopodobnie wynika to absolutnego zaniedbania jej przez właściciela. Pierwszy wpis datowany jest na 2004 rok, łącznie wpisy zajmują jedynie 15 stron, a witryny nie posiada innych treści. Jeśli jednak ktoś chciałby się przekonać, jak kreatywnie można podejść do pliku robots.txt, to sprawdzenie strony Johna powinien uznać za obowiązkowe. Powiedzmy tylko tyle, że w robots.txt Johna znajduje się więcej treści, niż na samej stronie…

Masowa deindeksacja stron w Google – podsumowanie

Każdy kolejny tydzień przynosi nam nowe informacje pokazujące skalę wpływu najnowszej aktualizacji typu Core Update. Google informowało, że całość działań ma zakończyć się dopiero 5 maja, co oznacza, że wciąż jesteśmy dopiero na początkowym etapie implementowanych zmian. Rozległe usuwanie z indeksu stron zaangażowanych w potępiane przez Google praktyki to nie wszystko. Spośród ponad 800 usuniętych stron, które analizował m.in. Ian Nuttall, wszystkie strony zawierały treści generowanych przez sztuczną inteligencję, przy czym aż połowa tych stron całkowicie bazowała na contencie A.I. Google otwarcie rozpoczyna walkę ze spamerskimi stronami, które znalazły się wysoko w wynikach wyszukiwania na skutek nieuczciwych praktyk z zakresu link buildingu i wygenerowanych treści.

Strony dotychczas usunięte z indeksu, przynosiły szacunkowe dochody właścicielom na poziomie prawie pół miliona dolarów miesięcznie. To oczywiście wyłącznie estymacje dotyczące systemów reklamowych, pomijając afiliacje, sponsoring, link building i inne ewentualne źródła dochodów. Szacunki dotyczą również tych stron, co do których mam pewność, że zostały usunięte. Tymczasem z dnia na dzień tego typu witryn wykluczonych z indeksu Google Search przybywa. Radzimy codziennie śledzić Google Search Console, bo sytuacja jest niezwykle dynamiczna.

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *