Pagerank Algorithmus

von | Mai 31, 2017 | Ranking Faktoren, Über Google

Larry Page und Sergei Brin entwickelten den PageRank – Algorithmus, welcher der Suchmaschine Google der von ihnen gegründeten Firma Google Inc., als Grundlage zur Bewertung von einzelnen Seiten im Internet diente. Die Überlegung dahinter war, dass eine Seite, auf die von vielen anderen Seiten verwiesen wird, wohl eine nützliche Seite sein muss. Dieses Prinzip wurde zuvor bereits, unter anderem, bei wissenschaftlichen Arbeiten angewandt. Sobald ein bestimmtes Paper in vielen anderen zitiert wurde, bzw. darauf verwiesen wurde, musste es wohl sehr nützlich sein, wurde dadurch immer bekannter und galt somit auch als „wichtiger“.

Der PageRank von Google

Die Formel, welche Larry Page 1997 zum Patent anmeldete (eingetragen auf die Stanford University), beschreibt kurz gesagt, mit welcher Wahrscheinlichkeit sich ein Zufallssurfer gerade auf einer bestimmten Seite befindet und sieht folgendermaßen aus:

PageRank Algorithmus (Formel zur Berechnung)


PRi
steht damit für eine Art Gewichtung einer bestimmten Seite i, in Abhängigkeit von den Gewichten PRj der auf i verlinkten Seite j. Verlinkt die Seite j nicht nur auf die Seite i, sondern auf cj verschiedene Seiten, erhält die Seite i nicht das gesamte Gewicht, sondern nur einen Teil davon. Weiters steht n für die Gesamt Anzahl der Seiten und d für den Dämpfungsfaktor (einer Zahl zwischen 0 und 1, mit der ein kleiner Anteil des Gewichts (1-d) einer jeden Seite abgezogen und gleichmäßig auf alle Seiten verteilt wird).

Beispiel zur Berechnung des PageRanks

Bei diesem Beispiel mit Dämpfungsfaktor d = 0.85 und n = 11 hätte somit die Seite A das größte Gewicht bzw. den höchsten PageRank. Eine wichtige Erkenntnis aus diesem Beispiel ist, dass die Seite B, obwohl sie von nur einer Seite einen Link erhält, das zweit höchste Gewicht hat. Das bedeutet nicht nur die Anzahl an Links spielt eine Rolle, sondern auch das Gewicht das weitergegeben wird! Seite A verlinkt außer auf Seite B, auf keine weitere Seite. Die Seite B erhält also den alleinigen Anteil.

Dieser Algorithmus beschreibt rein die Linkpopularität, was zu Beginn auch ausreichte und gut funktionierte – die Suchmaschine spuckte tatsächlich die nützlichsten Ergebnisse aus.

Anpassungen des Algorithmus

Schon bald jedoch verlinkten Webseitenbetreiber wie verrückt von möglichst vielen anderen externen Seiten (über Foreneinträge, Linktausch, bis hin zu erkauften Links) auf ihre Eigene, um ihren PageRank anzuheben, was dazu führte, dass der PageRank alleine, kaum noch etwas über die tatsächliche Qualität einer Seite aussagte.

Google musste also etwas unternehmen, um weiterhin die besten Links zu den inhaltlich nützlichsten Seiten zu liefern, anstatt Links zu Seiten auf die komplett zusammenhanglos aber möglichst oft verwiesen wird – ansonsten würde man früher oder später zu einer anderen Suchmaschine wechseln und Google hätte bald keine User mehr.

Um dieses Problem loszuwerden, machte Google einige Updates des Algorithmus, welche seitdem ständig weiter verfeinert werden:

  • Rational Surfer Modell (seit 2010) Weiterentwicklung des Zufallsmodels, um Linkkauf entgegenzuwirken
  • Panda Update (seit 2011) um Seiten mit hochwertigem Inhalt besser zu werten
  • Penguin Update (seit 2012) um überoptimierte oder manipulierte Webseiten herabzusetzen
  • Hummingbird Algorithmusmodifikation (seit 2013) kann nun, statt nur einzelne Worte, Zusammenhänge mehrerer Worte bzw. ganze Sätze aus Suchanfragen „verstehen“
  • RankBrain (seit 2015)

Der PageRank Algorithmus wurde also 2013 durch den Hummingbird Algorithmus ersetzt und 2015 mit Google’s Machine Learning und Künstlicher Intelligenz „RankBrain“ erweitert. Dennoch blieb der PageRank als Ranking Faktor weiterhin erhalten und ist damit einer von vielen Faktoren, den Hummingbird in seine Bewertung mit einbezieht.

Tina hat E-Commerce und Online-Marketing studiert, ist Inhaberin von WebBoost und arbeitet als IT-Technikerin am OFI.
Tina Lentschik, MSc

Inhaberin, WebBoost

Pin It on Pinterest

Share This