Google PageRank erklärt für SEO-Anfänger (festlicher Rückblick)
Feiern Sie die Feiertage mit einigen der besten SEJ-Artikel des Jahres 2023.
Unsere festliche Flashback-Reihe läuft vom 21. Dezember bis 5. Januar und bietet tägliche Lektüren zu wichtigen Ereignissen, Grundlagen, umsetzbaren Strategien und Meinungen von Vordenkern.
Das Jahr 2023 war in der SEO-Branche ziemlich ereignisreich und unsere Mitwirkenden haben einige herausragende Artikel verfasst, um Schritt zu halten und diese Veränderungen widerzuspiegeln.
Informieren Sie sich über die besten Lektüre des Jahres 2023, damit Sie auf dem Weg ins Jahr 2024 viel zum Nachdenken haben.
PageRank war einst das Herzstück der Suche – und hat Google zu dem Imperium gemacht, das es heute ist.
Auch wenn Sie glauben, dass sich die Suche vom PageRank weiterentwickelt hat, lässt sich nicht leugnen, dass sie seit langem ein allgegenwärtiges Konzept in der Branche ist.
Jeder SEO-Profi sollte ein gutes Verständnis davon haben, was PageRank war – und was es auch heute noch ist.
In diesem Artikel behandeln wir Folgendes:
- Was ist PageRank?
- Die Geschichte der Entwicklung von PageRank.
- Wie PageRank die Suche revolutionierte.
- Toolbar PageRank vs. PageRank.
- So funktioniert PageRank.
- Wie PageRank zwischen Seiten fließt.
- Wird PageRank noch verwendet?
Lass uns eintauchen.
Was ist PageRank?
PageRank wurde von den Google-Gründern Larry Page und Sergey Brin entwickelt und ist ein Algorithmus, der auf der kombinierten relativen Stärke aller Hyperlinks im Internet basiert.
Die meisten Leute argumentieren, dass der Name auf dem Nachnamen von Larry Page basiert, während andere meinen, „Page“ beziehe sich auf eine Webseite. Beide Positionen sind wahrscheinlich wahr, und die Überschneidung war wahrscheinlich beabsichtigt.
Als Page und Brin an der Stanford University waren, schrieben sie einen Artikel mit dem Titel: Das PageRank Citation Ranking: Ordnung ins Web bringen.
Das im Januar 1999 veröffentlichte Papier demonstriert einen relativ einfachen Algorithmus zur Bewertung der Stärke von Webseiten.
Das Papier wurde später in den USA zum Patent erklärt (jedoch nicht in Europa, wo mathematische Formeln nicht patentierbar sind).
Die Stanford University besitzt das Patent und hat es an Google übertragen. Das Patent läuft derzeit im Jahr 2027 aus.
Die Geschichte der Entwicklung des PageRank
Während ihrer Zeit in Stanford Ende der 1990er Jahre beschäftigten sich sowohl Brin als auch Page mit Methoden zur Informationsbeschaffung.
Zu dieser Zeit war die Verwendung von Links, um herauszufinden, wie „wichtig“ jede Seite im Verhältnis zu einer anderen war, eine revolutionäre Art, Seiten zu ordnen. Es war rechentechnisch schwierig, aber keineswegs unmöglich.
Aus der Idee wurde schnell Google, das zu dieser Zeit ein kleiner Akteur in der Welt der Suche war.
Der institutionelle Glaube einiger Parteien an den Ansatz von Google war so groß, dass das Unternehmen seine Suchmaschine zunächst ohne die Möglichkeit startete, Einnahmen zu erzielen.
Und während Google (damals bekannt als „BackRub“) die Suchmaschine war, war PageRank der Algorithmus, mit dem Seiten auf den Ergebnisseiten der Suchmaschinen (SERPs) eingestuft wurden.
Der Google Dance
Eine der Herausforderungen von PageRank bestand darin, dass die Mathematik zwar einfach, aber iterativ verarbeitet werden musste. Die Berechnung läuft mehrfach, über jede Seite und jeden Link im Internet. Um die Jahrtausendwende dauerte die Verarbeitung dieser Mathematik mehrere Tage.
Die Google SERPs bewegten sich in dieser Zeit auf und ab. Diese Änderungen waren oft unregelmäßig, da für jede Seite neue PageRanks berechnet wurden.
Dies war als „Google-Tanz“ bekannt und hat die damaligen SEO-Profis jedes Mal, wenn Google sein monatliches Update startete, aufgehalten.
(Der Google Dance wurde später zum Namen einer jährlichen Party, die Google in seinem Hauptsitz in Mountain View für SEO-Experten veranstaltete.)
Vertrauenswürdige Samen
Eine spätere Iteration von PageRank führte die Idee eines „vertrauenswürdigen Startwerts“ ein, um den Algorithmus zu starten, anstatt jeder Seite im Internet den gleichen Anfangswert zu geben.
Vernünftiger Surfer
Eine weitere Iteration des Modells führte die Idee eines „vernünftigen Surfers“ ein.
Dieses Modell legt nahe, dass der PageRank einer Seite möglicherweise nicht gleichmäßig mit den Seiten geteilt wird, auf die sie verlinkt – sondern dass der relative Wert jedes Links basierend darauf gewichtet werden könnte, wie wahrscheinlich es ist, dass ein Benutzer darauf klickt.
Der Rückzug des PageRank
Der Algorithmus von Google galt intern zunächst als „nicht spamfähig“, da die Wichtigkeit einer Seite nicht nur durch ihren Inhalt bestimmt wurde, sondern auch durch eine Art „Abstimmungssystem“, das durch Links zur Seite generiert wurde.
Das Vertrauen von Google war jedoch nicht von Dauer.
Mit dem Wachstum der Backlink-Branche begann der PageRank problematisch zu werden. Daher zog Google es aus der Öffentlichkeit zurück, verließ sich jedoch bei seinen Ranking-Algorithmen weiterhin darauf.
Die PageRank-Symbolleiste wurde 2016 zurückgezogen und schließlich wurde der gesamte öffentliche Zugriff auf PageRank eingeschränkt. Aber vor allem Majestic (ein SEO-Tool) konnte seine eigenen Berechnungen mittlerweile recht gut mit dem PageRank korrelieren.
Bis Januar 2017 hat Google viele Jahre damit verbracht, SEO-Profis durch die Dokumentation seiner „Google-Richtlinien“ und durch Ratschläge seines Spam-Teams unter der Leitung von Matt Cutts davon abzuhalten, Links zu manipulieren.
Auch die Algorithmen von Google veränderten sich in dieser Zeit.
Das Unternehmen verließ sich weniger auf PageRank und nach dem Kauf von MetaWeb und seinem proprietären Knowledge Graph (im Jahr 2014 „Freebase“ genannt) begann Google, die Informationen der Welt auf unterschiedliche Weise zu indizieren.
Toolbar-PageRank vs. Seitenrang
Google war zunächst so stolz auf seinen Algorithmus, dass es das Ergebnis seiner Berechnung gerne öffentlich jedem zugänglich machte, der es sehen wollte.
Die bemerkenswerteste Darstellung war eine Symbolleistenerweiterung für Browser wie Firefox, die für jede Seite im Internet einen Wert zwischen 0 und 10 anzeigte.
Tatsächlich verfügt der PageRank über eine viel größere Bandbreite an Werten, aber 0–10 gab SEO-Profis und Verbrauchern eine sofortige Möglichkeit, die Wichtigkeit einer beliebigen Seite im Internet einzuschätzen.
Die PageRank Toolbar machte den Algorithmus extrem sichtbar, was allerdings auch mit Komplikationen verbunden war. Dies bedeutete insbesondere, dass klar war, dass Links der einfachste Weg waren, Google auszutricksen.
Je mehr Links (oder genauer gesagt, je besser der Link), desto besser könnte eine Seite in den SERPs von Google für jedes gezielte Keyword ranken.
Dies bedeutete, dass ein Sekundärmarkt entstand, auf dem Links gekauft und verkauft wurden, deren Wert sich nach dem PageRank der URL richtete, unter der der Link verkauft wurde.
Dieses Problem wurde noch verschärft, als Yahoo ein kostenloses Tool namens Yahoo Search Explorer auf den Markt brachte, das es jedem ermöglichte, Links zu einer bestimmten Seite zu finden.
Später bauten zwei Tools – Moz und Majestic – auf der kostenlosen Option auf, indem sie eigene Indizes im Internet bauten und Links separat auswerteten.
Wie PageRank die Suche revolutionierte
Andere Suchmaschinen verließen sich stark darauf, den Inhalt jeder Seite einzeln zu analysieren. Mit diesen Methoden konnte der Unterschied zwischen einer einflussreichen Seite und einer einfach mit zufälligem (oder manipulativem) Text geschriebenen Seite kaum festgestellt werden.
Dies bedeutete, dass die Abrufmethoden anderer Suchmaschinen für SEO-Profis extrem einfach zu manipulieren waren.
Der PageRank-Algorithmus von Google war also revolutionär.
Kombiniert mit einem relativ einfachen Konzept von „nGrams“, um die Relevanz zu ermitteln, hat Google eine Erfolgsformel gefunden.
Es überholte bald die wichtigsten etablierten Anbieter der damaligen Zeit, wie AltaVista und Inktomi (die unter anderem MSN betrieben).
Durch die Arbeit auf Seitenebene fand Google auch eine viel skalierbarere Lösung als der „verzeichnisbasierte“ Ansatz von Yahoo und später von DMOZ – obwohl DMOZ (auch Open Directory Project genannt) Google zunächst eine Open-Source-Lösung zur Verfügung stellen konnte eigenes Verzeichnis.
Wie PageRank funktioniert
Die Formel für den PageRank gibt es in verschiedenen Formen, sie lässt sich jedoch in wenigen Sätzen erklären.
Zunächst erhält jede Seite im Internet einen geschätzten PageRank-Score. Dies kann eine beliebige Zahl sein. In der Vergangenheit wurde der PageRank der Öffentlichkeit als Wert zwischen 0 und 10 präsentiert, in der Praxis müssen die Schätzungen jedoch nicht in diesem Bereich beginnen.
Der PageRank für diese Seite wird dann durch die Anzahl der Links von der Seite geteilt, was einen kleineren Bruchteil ergibt.
Der PageRank wird dann auf die verlinkten Seiten verteilt – und das Gleiche gilt für jede andere Seite im Internet.
Für die nächste Iteration des Algorithmus ist die neue Schätzung für den PageRank für jede Seite dann die Summe aller Bruchteile von Seiten, die auf jede bestimmte Seite verweisen.
Die Formel enthält auch einen „Dämpfungsfaktor“, der als die Wahrscheinlichkeit beschrieben wurde, dass eine Person, die im Internet surft, ganz mit dem Surfen aufhört.
Bevor jede weitere Iteration des Algorithmus beginnt, wird der vorgeschlagene neue PageRank um den Dämpfungsfaktor reduziert.
Diese Methode wird wiederholt, bis die PageRank-Werte ein ausgeglichenes Gleichgewicht erreichen. Die resultierenden Zahlen wurden dann der Einfachheit halber im Allgemeinen in einen besser erkennbaren Bereich von 0 bis 10 transponiert.
Eine Möglichkeit, dies mathematisch darzustellen, ist:
Wo:
- PR = PageRank in der nächsten Iteration des Algorithmus.
- d = Dämpfungsfaktor.
- j = die Seitennummer im Internet (wenn jede Seite eine eindeutige Nummer hätte).
- n=Gesamtzahl der Seiten im Internet.
- i = die Iteration des Algorithmus (ursprünglich auf 0 gesetzt).
Die Formel kann auch in Matrixform ausgedrückt werden.
Probleme und Iterationen der Formel
Die Formel birgt einige Herausforderungen.
Wenn eine Seite nicht auf eine andere Seite verlinkt, wird die Formel kein Gleichgewicht erreichen.
In diesem Fall würde der PageRank also auf jede Seite im Internet verteilt. Auf diese Weise könnte sogar eine Seite ohne eingehende Links erhalten werden manche PageRank – aber es würde sich nicht genug ansammeln, um signifikant zu sein.
Eine weitere, weniger dokumentierte Herausforderung besteht darin, dass möglicherweise neuere Seiten verfügbar sind mehr wichtiger sind als ältere Seiten, haben einen niedrigeren PageRank. Das bedeutet, dass alte Inhalte mit der Zeit einen unverhältnismäßig hohen PageRank haben können.
Die Zeit, die eine Seite online war, wird im Algorithmus nicht berücksichtigt.
Wie der PageRank zwischen den Seiten fließt
Wenn eine Seite mit einem Wert von 5 beginnt und 10 Links enthält, erhält jede Seite, auf die sie verlinkt, einen PageRank von 0,5 (abzüglich des Dämpfungsfaktors).
Auf diese Weise fließt der PageRank zwischen den Iterationen durch das Internet.
Wenn neue Seiten ins Internet gelangen, weisen sie zunächst nur einen geringen PageRank auf. Wenn jedoch andere Seiten beginnen, auf diese Seiten zu verlinken, steigt ihr PageRank mit der Zeit.
Wird PageRank noch verwendet?
Obwohl der öffentliche Zugriff auf PageRank im Jahr 2016 entfernt wurde, wird davon ausgegangen, dass der Score weiterhin für Suchmaschineningenieure bei Google verfügbar ist.
Ein Leak der von Yandex verwendeten Faktoren zeigte, dass PageRank weiterhin ein Faktor war, den es nutzen konnte.
Google-Ingenieure haben vorgeschlagen, die ursprüngliche Form des PageRank durch eine neue Näherung zu ersetzen, deren Berechnung weniger Rechenleistung erfordert. Während die Formel für die Rangfolge von Google-Seiten weniger wichtig ist, bleibt sie für jede Webseite eine Konstante.
Und unabhängig davon, welche anderen Algorithmen Google möglicherweise verwendet, ist PageRank wahrscheinlich bis heute in vielen Systemen des Suchgiganten verankert.
Dixon erklärt in diesem Video ausführlicher, wie PageRank funktioniert:
Originalpatente und -papiere für eine tiefergehende Lektüre:
- Methode zum Knotenranking in einer verknüpften Datenbank.
- Das PageRank Citation Ranking: Ordnung ins Web bringen
- Die Anatomie einer großen hypertextuellen Websuchmaschine
Mehr Ressourcen:
- Informationsbeschaffung: Eine Einführung für SEOs
- Lernen Sie den Google Knowledge Graph und seine Funktionsweise kennen
- Fortgeschrittenes technisches SEO: Ein vollständiger Leitfaden
Ausgewähltes Bild: VectorMine/Shutterstock