Chociaż praca specjalisty SEO coraz bardziej uzależniona jest od korzystania z takich narzędzi, jak Semrush czy Ahrefs, wciąż istnieją pola, w których liczy się kreatywność i umiejętności ścisłe. Wykorzystanie niecodziennych technik w pozycjonowaniu może przynieść wyjątkowe korzyści, zwłaszcza gdy mamy do czynienia z rozbudowanymi bazami danych. Dowodzi tego zastosowanie analizy korelacji, która służy do wyszukiwania zbieżności i rozbieżności pomiędzy poszczególnymi ciągami danych. Dzięki temu możliwe jest zidentyfikowanie kluczowych obszarów wymagających poprawy, a także dostrzeżenie okazji rynkowych i niezagospodarowanych nisz. Zobacz, jak zwiększyć skuteczność pozycjonowania przy wykorzystaniu podstawowej i zaawansowanej analizy korelacji!
Analiza korelacji w pozycjonowaniu stron
Pomimo rosnącej automatyzacji pozycjonowanie wciąż nie sprowadza się wyłącznie do gotowych wskaźników i raportów generowanych przy pomocy narzędzi analitycznych. Wbrew pozorom intuicja też jest istotna. Doświadczony seowiec często ma przeczucie co do tego, jakie czynniki wpływają na rankingi i co może wynika z zaobserwowania wielu różnych sytuacji, które były powodowane przez konkretne czynniki. Taką przykładową obserwacją może być to, że strony z większą ilością linków zwrotnych zazwyczaj zajmują wyższe pozycje niż strony, których czas ładowania się jest ultra krótki, pomimo że obydwa czynniki, a zwłaszcza czas ładowania, mogą być uznawana za rankingowe.
Matematyczne sposoby mogą pomóc w potwierdzeniu lub kwestionowaniu znaczenia różnych czynników rankingowych. Jednym z kluczowych narzędzi jest analiza korelacji. Stosuje się ją w obrębie SEO w różnych obszarach, takich jak:
- komparatystyka jakości względem liczby domen odsyłających w danej branży,
- analiza relacji między publikowaną treścią a ruchem na stronie,
- znaczenie różnych czynników rankingowych w określonych wynikach SERP.
W tym artykule przyjrzymy się nieco bardziej temu zagadnieniu, sprawdzając, do czego dziś może przydać się analizy korelacji w SEO i w jaki sposób ją stosować.
Co bada i do czego przyda się analiza korelacji w SEO?
Zasadnicze pytanie, które należy postawić na początku, brzmi następująco: jeśli mamy pewność, że Google w sposób stały i niezmienne kieruje się pewnymi zasadami rankingowymi, czy analiza korelacji wyników wyszukiwania, może unaocznić ich wpływ? Jak w większości pytań dotyczących SEO, odpowiedź brzmi: „to zależy”.
Identyfikacja roli czynników rankingowych i ich znaczenia dla SERP jest trudna, ponieważ różne czynniki rankingowe mogą nie odpowiadać rankingom w sposób liniowy lub konsekwentnie rosnący/malejący. Co więcej, jak wynika chociażby z opisywanego na naszym blogu przecieku Google API, czynniki rankingowe są wbrew pozorom bardzo złożone i mocno zmienne. W przeciwieństwie do tego, jak wyglądało SEO 10 lat temu, dziś niezwykle duże znaczenie ma historia użytkownika i całokształt danych, które Google pobrał o danym użytkowniku, ponieważ są to zbiory wykorzystywane przy generowaniu SERP.
Korelacja Pearsona w SEO
Przed przystąpieniem do analizy określonych czynników rankingowych dla SERP, konieczne jest zrozumienie podstaw korelacji i wyboru metody, która da najlepsze wyniki dla danego czynnika rankingowego. Pierwszym narzędziem może być korelacja Pearsona, która szuka prostoliniowych zależności między dwoma czynnikami wyrażanymi w formie zbiorów danych rozproszonych. Korelacja Pearsona może być przydatna w różnych zadaniach SEO.
Przykładem zastosowania korelacji Pearsona w obrębie pozycjonowania może być analiza związku pomiędzy długością treści a pozycją poszczególnych podstron w rankingu na określone słowo kluczowe.
W powyższym przykładzie widoczna jest idealna korelacja. Wraz ze spadkiem długości publikacji pozycja w rankingu jest coraz niższa. W tym przypadku każdy spadek o 200 słów odpowiada spadkowi o jedno miejsce w rankingu.
Oczywiście powyższy przykład ma charakter wyłącznie eksplanacyjny, a metodolodzy słusznie mogliby zarzucić, że wykres de facto nie przedstawia korelacji Pearsona, lecz zwykłą korelację statystyczną, tutaj konkretnie – ujemną. Osobną kwestią jest też to, że korzystając z rzeczywistych danych SEO rzadko kiedy będzie występowała taka korelacja. Gdyby strona na 3 miejscu miała 1750 słów zamiast 1600, nadal istniałaby silna korelacja, ale nie byłaby tak wyraźna.
Korelacja Pearsona w SEO jest najbardziej użyteczna, gdy dane mają charakter rozproszony, ciągi składają się co najmniej z kilkudziesięciu czynników, a analizowane czynniki mają charakter stały i liniowy. Tzw. reguła 30 dla korelacji Pearsona wskazuje, że dla korelacji, aby była statystycznie istotna, potrzebna jest próba składająca się z co najmniej trzydziestu analizowanych wariantów. Wywodzi się to z tzw. Granicznego Twierdzenia Centralnego, zgodnie z którym rozkład zbioru zmiennych losowych o tym samym rozkładzie (niekoniecznie normalnym) zbiega do rozkładu normalnego (przy n dążącym do nieskończoności). Innymi słowy, przy wystarczająco dużej próbie (n ≥ 30), rozkład próbkowy współczynnika korelacji będzie w przybliżeniu normalny, co pozwala na bardziej niezawodne i ważne testowanie istotności.
Korelacja Spearmana w SEO
Kolejnym narzędziem jest korelacja Spearmana, która bada, czy jeden czynnik ma tendencję do wzrostu bądź spadku wraz z innym, nawet jeśli relacja nie jest idealnie stała. Piękno korelacji Spearmana polega na tym, że idealnie sprawdza się na danych pochodzących z rankingów znanych narzędzi SEO. Dobrym przykładem mogą być dane Ahrefs.
Powyższy wykres obrazuje związek między Ahrefs Domain Rating (DR) strony a jej rankingiem dla określonego słowa kluczowego. Pierwsze dane nie mają charakteru liniowego. Wartości DR można przekształcić na dane rankingowe od najwyższego do najniższego:
– 85 (Rank 1)
– 78 (Rank 2)
– 72 (Rank 3)
– 65 (Rank 4)
– 45 (Rank 5)
Następnym krokiem jest zestawienie rankingów DR z rankingami SERP:
– SERP Rank 1: DR Rank 1
– SERP Rank 2: DR Rank 2
– SERP Rank 3: DR Rank 3
– SERP Rank 4: DR Rank 4
– SERP Rank 5: DR Rank 5
W tym przypadku uzyskuje się idealną korelację Spearmana, mimo że pierwotne dane nie były liniowe. Należy pamiętać oczywiście o tym, że korelacja Spearmana bada relację między tymi rankingami, a nie wartościami surowymi. Osobną kwestią jest to, że podejście to pomaga wygładzić nieliniowe zależności i zmniejsza wpływ odstających wartości. W SEO, gdzie wiele czynników nie ma idealnie liniowej zależności z rankingami, korelacja Spearmana często daje jaśniejszy obraz ogólnych trendów i pozwala obserwować ciekawe zmiany w rankingu.
Problemy związane z wykorzystaniem korelacji
Trudności w korzystaniu z analiz korelacji dotyczą przede wszystkim doboru analizowanych czynników. Badając indywidualne czynniki rankingowe, analiza korelacji nie sprawdzi się ze względu niewystarczającą podstawę statystyczną. Problematyczne jest też zestawianie ze sobą czynników rankingowych Google, które występują równolegle oraz takich, pomiędzy którymi nie jest określony ciąg przyczynowo-skutkowy.
Ważne jest również zrozumienie, że niektóre czynniki rankingowe mogą znacznie przewyższać znaczeniowo inne. Google nie informuje publicznie, które czynniki są najistotniejsze, nie mamy informacji dotyczących obowiązującego systemu rankingowego. Wiadomo jednak, że np. jakość tekstów oceniana jest zupełnie inaczej, niż zabezpieczenie strony w certyfikat SSL, nie mówiąc już o poprawnym zaindeksowaniu witryny, stronach-duplikatach i hierarchii onsite. Ze względu na to, że są pewne dominujące czynniki rankingowe, a nie jesteśmy w stanie odgórnie założyć, które w analizowanej parze będą miały taki charakter, analizy korelacji mogą nie dostarczyć informacji jasno sugerujących określony sposób działania. Z tego powodu warto zestawiać ze sobą raczej te czynniki, które:
- są rozproszone, liniowe i reprezentowane przez duże zbiory danych,
- nie występują w bezpośredniej relacji (np. lepiej porównać długość treści i pozycje w rankingu niż długość treści i liczbę podstron blogowych),
- jest pewność co do rzetelności ich pochodzenia.
Analiza korelacji w SEO – podsumowanie
Stosowanie analizy korelacji w różnych pracach związanych z pozycjonowaniem nie musi, ale może być niezwykle owocne. Przede wszystkim w ten sposób mamy szansę na znalezienie pewnych prawidłowości, które nie dostarczają nam gotowe narzędzia. Najbardziej przydają się do tego korelacji Pearsona i Spearmana. Aby wyniki były rzetelne i wiarygodne, trzeba pamiętać o wymogach metodologicznych poszczególnych metod badawczych, np. tzw. regule 30 w przypadku korelacji Pearsona. Największą zaletą jest to, że często w trakcie tego typu badań, jeśli nawet nie uda się zweryfikować postawionego celu, znajdziemy dodatkowe informacje, na które nie natrafilibyśmy w inny sposób!