| Google hat eine Machtposition unter den Suchmaschinen erlangt. Dieser Tatsache sollte ein Website-Betreiber bei der Entwicklung von Marketingstrategien für seine Webpräsenz ein hohes Maß an Beachtung schenken. Wer sich für das Google-Ranking interessiert und diese Suchmaschine besser verstehen möchte, erfährt hier mehr darüber. Wir von Selfoptimizer haben uns mit dem Grundgedanken von Google auseinander gesetzt. Für die Besucher unserer Website haben wir das wichtigste Element der Suchmaschine Google einmal genauer durchleuchtet. Hier finden Sie 11 Beispiele die Ihnen Schritt für Schritt, Punkt für Punkt alles erläutern. PageRank stellt für Google je nach dem ein positives oder negatives Urteil über eine Website dar. Angenommen wir wollen den PageRank-Wert der Seite A berechnen. Um diesen Wert herauszufinden müssen wir folgende Faktoren berücksichtigen: - Anzahl der eingehenden Links zur Seite A.
- Die PageRank-Werte der Seiten die zur Seite A linken.
- Anzahl der ausgehenden Links der einzelnen Seiten die zur Seite A linken.
In allgemeinen stellt PageRank die Summe der PageRank-Werte der eingehenden Links zur Seite A dar. Dieser Wert steigt mit jedem zusätzlichen eingehenden Link an. Um dies zu verhindern wurde ein Dämpfungsfaktor in die Kalkulation mit einbezogen. Die Formel lautet dann PR(A)=(1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)) Wobei PR(A) PageRank der Seite A d Dämpfungsfaktor um die Steigerung des Wertes zu verhindern T1 Seite T1 die zu Seite A linkt PR(T1) PageRank der Seite T1 C(T1) Anzahl der abgehenden Links von Seite T1 * Der Dämpfungsfaktor beträgt 0,85 |
| Beispiel: | |
| Seite A erhält Links von den Seiten T1, T2 und T3 Zuerst wird der PageRank der Seite T1 die zur Seite A linkt berechnet. Dann wird das Ergebnis durch die Anzahl der ausgehenden Links der Seite T1 dividiert PR(T1)/C(T1). Auf die gleiche Art und Weise werden die Werte von T2 und T3 berechnet. Die Werte werden zusammen wie folgt addiert E=PR(T1)/C(T1) + PR(T2)/C(T2) + PR(T3)/C(T3) Dann kommt der Dämpfungsfaktor wie folgt zum Einsatz 0,85*E Als letztes wird das Ergebnis zu (1 - 0,85) addiert. Die Zahl 1 sollte den minimalen PageRank-Wert darstellen. Davon wird der Dämpfungsfaktor abgerechnet. Das bedeutet, eine Website ohne eingehende Links verfügt immer über einen PageRank-Wert von 1-0,85 = 0,15 |
| Das Random Sufer Model | |
| Google Gründer Larry Page und Sergy Brin integrierten einen wichtigen Bestandteil in ihren PageRank-Algorithmus und zwar, der Surfer. Sie gingen davon aus, dass Besucher einer Webseite Links verfolgen die auf dieser Webseite existieren. Wenn die Webseite A über einen einzigen Link verfügt der zur Seite B führt, liegt die Wahrscheinlichkeit, dass der Besucher der Seite A auf den Link klickt und die Seite B betrachtet, bei 100%. Verfügt die Seite A über zwei Links die zu den Seiten B und C führen, reduziert sich die Wahrscheinlichkeit auf 50%. Bei 4 Links sind es dann 25% usw. In Bezug auf den PageRank-Algorithmus zeigt dies, die Vererbung des PageRank-Wertes ist von der Anzahl der abgehenden Links abhängig. Desto weniger Links sich auf einer Seite befinden, umso höher ist der Profit der an die verlinkte Seite abgegeben wird. Trotzdem kann ein Link von einer Seite die über einen PageRank von 7 verfügt niedrigere Werte abgeben, als ein Link von einer Seite die über einen PageRank von 4 verfügt. Nämlich dann, wenn die erste Seite mit dem PageRank 7 hunderte von Links besitzt. Zusätzlich wird auch die Wahrscheinlichkeit, dass der Surfer weiterklickt und seine Linkverfolgung fortsetzt, berücksichtigt. Es ergibt sich durch den Dämpfungsfaktor. In dieser Version gehen Page und Brin davon aus, dass die Summe des gesamten PageRanks des Webs 1 ist. Daraus wird der Dämpfungsfaktor errechnet. |
| Das Web als Grundlage der Berechnung von PageRank |
| Eine weitere Version der Berechnung von PageRank bezieht sich auch auf die Wahrscheinlichkeit, dass der Zufallssurfer eine Webseite besucht. Diesmal wird die Anzahl der gesamten Webseiten des Webs mit einbezogen. Die Formel lautet PR(A) = (1-d) / N + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)) Wobei N= Die gesamte Anzahl der Seiten im Web |
| Fakten rund um PageRank | |
| Die exakte Berechnung des PageRanks ist von der gesamten Anzahl der Websites im WWW und von dem höchst erreichten Wert aller Websites abhängig. Daher ist die exakte Übermittlung von PageRank nur für Google möglich. Die von Google-Toolbar zwischen 0 und 10 angezeigten Werte entsprechen nicht dem PageRank-Wert der von Google errechnet wird. Die richtigen Werte bestehen nicht aus Zahlen zwischen 1 und 10 sondern sie werden logarithmisch umgerechnet. In etwa so
| Toolbar-Wert | PR von | PR bis | | 1 | 0 | 10 | | 2 | 10 | 1.000 | | 3 | 1.000 | 10.000 | | 4 | 10.000 | 50.000 | | 5 | 50.000 | 150.000 | | 6 | 150.000 | 300.000 | etc... Wie bereits erwähnt, die genaue Berechnung dieser Werte kennt nur Google. Wäre die höchste erreichte Berechnung beispielsweise 1.000.000 rechnet Google 1.000.000 auf 10 um und leitet die anderen Toolbar-Werte aus dieser Berechnung ab. Experten gingen immer davon aus, dass die Anzahl der abgehenden Links einer Seite absolut keinen Einfluss auf deren eigenen PageRank, sondern einen Einfluss auf die Werte, die an den Zielseiten vererbt werden, hat. Ob dies den Tatsachen entspricht sehen wir später. PageRank sagt nichts über den Inhalt oder die Optimierung einer Website aus. PageRank informiert lediglich nur über die Werte die durch die Anzahl der eingehenden Links kalkuliert wurde. In dem veröffentlichten Dokument von Larry Page und Sergy Brin wurde der Dämpfungsfaktor mit 0,85 festgelegt. Mit der zunehmenden Popularität Googles wurden gegen Suchmaschinen-Spam einige Maßnahmen eingesetzt. Diese dienten dazu Tricks, die für die Manipulation des Algorithmus verantwortlich sind, zu verhindern. Webseiten, die gegen die Google-Regeln verstoßen, landen somit in bestimmten Filtern. Vermutlich werden hier höhere Dämpfungsfaktoren eingesetzt um PageRank-Werte zu reduzieren. |
| Die iterative Berechnung von PageRank |
| Anhand des nächsten Beispiels kann man feststellen wie komplex die Berechnung von PageRank ist. Angenommen, wir haben zwei Seiten die A und B genannt werden. Beide Seiten linken zu einander. |
| Beispiel 1: | |
 | In diesem Beispiel betrachten wir das Web als ein Netzwerk, welches aus zwei Seiten besteht. Eine präzise Berechnung von PageRank der Seite B kann nur übermittelt werden wenn wir den PageRank der Seite A bereits übermittelt haben. Nach dem gleichen Prinzip folgt die PageRank-Berechnung der Seite A. Es wäre auch klar, dass wenn eine der beiden Seiten einen Null-Wert besitzt, diese auch einen Null-Wert weiter vererbt. |
| Angenommen, wir hätten einen exakten Wert für die Seite A übermittelt. Die Seite A linkt aber weiter zur Seite B. Dies bedeutet, dass die Seite B schon bereits einen PageRank-Wert an die Seite A abgibt. Die Folge ist, dass der PageRank der Seite A - die wiederum zur Seite B linkt - dadurch höher geworden ist. Dadurch bewegt sich die Berechnung in Kreis. Wenn man die Formel von PageRank aber genauer betrachtet, kann man feststellen, dass eine Seite die angenommen über einen PageRank-Wert von 7 verfügt, keinen Wert von 7 weiterleitet, sondern einen Wert der durch dem Dämpfungsfaktor reduziert wird. Durch diese Reduktion verringert sich der Wert jedes Mal bevor er weiter vererbt wird. Dieser Vorgang sorgt für eine spiralförmige und nicht kreisförmige Berechnung die am Ende den Wert Null erreicht. Wie oft man diese Wiederholung durchführen kann, ist von verschiedenen Faktoren abhängig. Wenn man zum Beispiel von dem Wert Null, für die beiden Seiten ausgeht, erhalten wir nach 111 Wiederholungen einen PageRank-Wert von 1 für jede Seite. Wenn man aber von PR(10) ausgeht erhöht sich die Anzahl der Wiederholungen bis man den Wert 1 erreicht hat. Nach einer Anzahl von Wiederholungen erreicht die Berechnung einen Wert der sich nicht mehr weiter verändert. Zusätzlich sehen wir in diesem Beispiel, dass die Werte der beiden A und B sich in eine Richtung bewegen. Und zwar in Richtung der Endzahl eins. |
| | Beispiel im Tutorial auf der Webseite |
| Beispiel 2 | |
 | In diesem Beispiel wird die Verlinkung etwas komplexer und wir nähern uns einen kleinen Schritt in Richtung realem Web. Wir gehen diesmal von 4 Seiten aus die untereinander wie folgt verlinkt werden
- Seite A linkt zur Seite B - Seite B linkt zur Seite C - Seite C linkt zur Seite A - Seite D linkt zur Seite A
Nun sieht die PageRank-Kalkulation wie folgt aus PR(A)= 1-0.85+0.85*(PR(C)/1+PR(D)/1) PR(B)= 1-0.85+0.85*(PR(A)/1) PR(C)= 1-0.85+0.85*(PR(B)/1) PR(D)= 1-0.85+0.85*(0) |
 | Da Seite C nur einen Link beinhaltet wird für die Berechnung von PageRank der Seite A der PageRank von C durch 1 dividiert. Das gleiche gilt auch für die Seite D. Die Seiten B und C erhalten je einen eingehenden Link. B wird von A verlinkt und C wird von B verlinkt. Seite D erhält keinen einzigen eingehenden Link. Hier können wir feststellen, dass die Seite A den höchsten Wert aller 4 Seiten erreichen kann, im Gegensatz zur Seite D die den Mindestwert von 0.15 besitzt. Der Grund liegt auf der Hand. Seite A erhält zwei eingehende Links während Seite D keinen einzigen eingehenden Link bezieht. |
| | Beispiel auf der Webseite |
| Beispiel 3 | |
 | Hier sehen wir die PageRank-Werte eines Netzes, wenn die Startseite von allen internen Seiten erreichbar ist. Zusätzlich linkt die Startseite noch zu einer fremden Seite außerhalb des Netzes. Unser Netz besteht aus 4 Seiten A, B, C und D. Die Seite G kennzeichnet eine fremde Präsenz im Internet. Die Verlinkung sieht dann wie folgt aus: - Seite A linkt zur Seite B - Seite A linkt zur Seite C - Seite A linkt zur Seite D - Seite A linkt zur Seite G Seite A erhält eingehende Links von allen Seiten (B, C und D). |
 | Die Formeln sehen wie folgt aus: PR(A)= 1-0.85+0.85*(PR(B)/1+PR(C)/1+PR(D)/1) PR(B)= 1-0.85+0.85*(PR(A)/4) PR(C)= 1-0.85+0.85*(PR(A)/4) PR(D)= 1-0.85+0.85*(PR(A)/4) Wieder erhält Seite A die höchsten Werte. Oft wurde behauptet, dass abgehende Links keinen Nachteil mit sich tragen. Um dies feststellen zu können, entfernen wir die Verlinkung von Seite A zur Seite G. |
| | Beispiel auf der Webseite ansehen |
| Beispiel 4: | |
 | In diesem Beispiel sieht die Verlinkung genau wie im Beispiel 3 aus. Jedoch entfernen wir den Link von unserer Startseite A, der zu einer fremde Seite G führt. - Seite A linkt zur Seite B - Seite A linkt zur Seite C - Seite A linkt zur Seite D - Seite A erhält eingehende Links von allen Seiten (B, C und D). |
 | Unsere Formeln sehen dann so aus: PR(A)= 1-0.85+0.85*(PR(B)/1+PR(C)/1+PR(D)/1) PR(B)= 1-0.85+0.85*(PR(A)/3) PR(C)= 1-0.85+0.85*(PR(A)/3) PR(D)= 1-0.85+0.85*(PR(A)/3) |
Die Ergebnisse zeigen deutlich, dass Seite A (Startseite) mehr Werte von den Seiten B, C und D erhält, wenn die Seite A höhere Werte an die internen Seiten vererbt. Logisch, da die Berechnung von PR(A) diesmal anderes aussieht und zwar die Werte für B, C und D werden diesmal berechnet wenn A durch 3 und nicht durch 4 dividiert.
Das nächste Beispiel simuliert einen Linktausch von zwei Präsenzen. |
| Beispiel auf der Webseite |
| Beispiel 5: | |
 | In diesem Beispiel wird ein Linktausch zwischen 2 Präsenzen simuliert. Man sollte davon ausgehen, dass beide Seiten davon profitieren. Unsere Präsenz ist hier in der Grafik auf der rechten Seite sichtbar. Die Seite A stellt unsere Startseite dar. An der internen Verlinkung hat sich nichts geändert. Nur hier sehen wir, dass die Seite D einen abgehenden Link zur Seite E besitzt. Die Seite E ist hier die Startseite von einer fremden Präsenz. Als Gegenzug erhält unsere Startseite von der Seite H ebenfalls einen Link. |
 | Die Formeln von den fremden Präsenz lauten: PR(E)=1-0.85+0.85*(PR(F)/1+ PR(G)/1+PR(H)/2+PR(D)/2) PR(F)= 1-0.85+0.85*(PR(E)/3) PR(G)= 1-0.85+0.85*(PR(E)/3) PR(H)= 1-0.85+0.85*(PR(E)/3) Nach 101 Wiederholungen haben wir dann unsere Ergebnisse. |
| Was wir hier sehen ist eindeutig. Durch einen Linktausch zwischen den beiden Präsenzen hat sich der PageRank-Wert von unserer Startseite A gar nicht erhöht. Grund dafür ist, dass wir zwar einen Link von außen erhalten haben, zugleich aber einen reduzierten Link-Wert von der Seite D. Da diese nun einen zusätzlichen Link zur Seite E beinhaltet. Wie wäre es dann wenn wir nicht zu der fremden Seite linken würden? Anhand des nächsten Beispiels sehen wir es deutlich. |
| Beispiel auf der Webseite |
| Beispiel 6 | |
 | Diesen Beispielen entnehmen wir die gleiche Linkstruktur beider Präsenzen wie im Beispiel 5. Mit dem Unterschied, dass wir den Link von unserer Seite D zur Seite E entfernen. Nun lauten unsere Formeln: PR(A)= 1-0.85+0.85*(PR(B)/1+PR(C)/1+PR(D)+PR(H)/2) PR(B)= 1-0.85+0.85*(PR(A)/3) PR(C)= 1-0.85+0.85*(PR(A)/3) PR(D)= 1-0.85+0.85*(PR(A)/3) |
 | Die Formeln für die fremde Seite sehen wie folgt aus: PR(E)= 1-0.85+0.85*(PR(F)/1+ PR(G)/1+PR(H)/2) PR(F)= 1-0.85+0.85*(PR(E)/3) PR(G)= 1-0.85+0.85*(PR(E)/3) PR(H)= 1-0.85+0.85*(PR(E)/3) |
| Die Ergebnisse sind recht erstaunlich. Der Link von D zu E kostete fast ein Drittel des aktuellen Wertes. In de Praxis sieht es etwas besser aus, da das WWW nicht nur über zwei Präsenzen verfügt sondern über mehre Milliarden von Präsenzen, die zum Teil zusammen verlinkt sind. Daher spielt ein Link mehr oder weniger kaum eine Rolle. Außerdem. wie anfangs erwähnt, handelt es sich hier nicht um Werte von 1, 2 oder 3 sondern die Werte bewegen sich in Bereichen von 1.000 aufwärts, überhaupt wenn sich eine Website in einem größeren Netz von Links befindet. Das nächste Beispiel macht diese Behauptung deutlicher. |
| Beispiel auf der Webseite |
| Beispiel 7: | |
 | In diesem Beispiel stellen wir den Link zur Seite E zurück. Zusätzlich sorgen wir für zwei eingehende Links von den Seiten I und J zu unserer Startseite A. Die Grafik macht dieses Beispiel gut vorstellbar. |
 | Die Formeln unserer Präsenz lauten: PR(A)= 1-0.85+0.85*(PR(B)/1+PR(C)/1+PR(D)/2+PR(J)/1+PR(I)/1) PR(B)= 1-0.85+0.85*(PR(A)/3) PR(C)= 1-0.85+0.85*(PR(A)/3) PR(D)= 1-0.85+0.85*(PR(A)/3) |
| An dieser Stelle werden wir auf die Anzeige der Berechnung von den fremden Seiten verzichten, da wir uns ab jetzt auf unsere Präsenz konzentrieren. Die Seiten E bis J werden aber trotzdem in die Berechnung mit einbezogen. Die Grafik zeigt uns, dass unsere Startseite durch die Verlinkung von den Seiten I und J bereits an Wert gewonnen hat. Wir dürfen hier trotzdem nicht vergessen, dass bei den gesamten Berechnungen in allen Beispielen von einem PageRank 0 für alle Seiten ausgegangen wird. Hätte die Seite I zum Beispiel über einen PageRank-Wert von 5 verfügt, wäre der Wert für unsere Startseite um einiges mehr. Und zwar wäre es dann 14.02 statt 2.62. Hätte zusätzlich die Seite J einen PageRank-Wert von 3, wäre der PageRank-Wert der Seite A 20.73. Wäre der Link von Seite D zur Seite E nicht vorhanden, hätte unsere Startseite einen Wert über 4.20 erreichen können usw. |
| Beispiel auf der Webseite |
| Die interne Verlinkung | |
| Wie wir nun bereits wissen, ist PageRank ziemlich stark im Google Algorithmus verankert. Seiten die durchaus relevant sind, werden zum Teil gar nicht in den Suchergebnissen von Google aufgelistet oder sie befinden sich irgendwo auf der 300ten Stelle, wo kein Nutzer mehr hinkommt. Bei der Erstellung einer neuen Website sollte man darauf achten, dass die Website intern möglichst gut verlinkt ist. Die interne Verlinkung ist für die Aufteilung von PageRank-Werten entscheidend. Wichtige Seiten sollten soweit gut verlinkt werden, dass sie die höchst mögliche zugewiesene PageRank-Werte erhalten. Mit wichtigen Seiten sind Seiten gemeint, die wichtige Suchbegriffe beinhalten Hier eignen sich Sitemaps oder eine direkte Verlinkung von der Startseite. So kann der Besucher nach maximal 2 bis 3 Klicks, von der Startseite aus, die wichtigen Seiten erreichen. |
| Beispiel 8: | |
 | An diesem Beispiel kann man erkennen, dass eine Verlinkung diese Art kaum etwas bringt. Unsere Startseite (A) wird von keiner der drei anderen Seiten verlinkt. Dadurch erhält sie den mindest PageRank-Wert 0.15. Am besten hat hingegen die Seite D abgeschnitten. Sie profitierte von den eingehenden Links zur Seite B und C und befindet sich als letzte in der Konstruktion der Verlinkung. Die Userfreundlichkeit ist natürlich hier sehr vernachlässigt. Befindet sich ein Besucher auf einer der Seiten B, C oder D, hat er keine Möglichkeit zur Startseite zurück zu kehren. In dem nächsten Beispiel wurde ein Link von Seite D zur Seite A gesetzt. |
| Beispiel auf der Webseite |
| Beispiel 9: | |
 | Hier sehen wir wie der PageRank gleichmäßig auf allen vier Seiten verteilt wird. Trotzdem ist die Struktur nicht als Userfreundlich zu bezeichnen. Wenn Ein Besucher sich auf eine der Seiten B oder C, hat er keine Möglichkeit zur Seite A zu gelangen. Die Seiten C und D sind von Seite A nicht erreichbar. |
| Beispiel auf der Webseite |
| Beispiel 10: | |
| Hier simulieren wir eine Verlinkung einer größeren aber durchaus herkömmlichen Präsenz. Die Website besteht hier aus einer Startseite, einer Kontaktmöglichkeit, einem Bereich für Produkte, einem Bereich für Services und einem Bereich für News. |
| |
| Die Einteilung der Verlinkung gestaltet sich recht einfach, wie es hier grafisch dargestellt wird. Unser Konzept bildet sich wie folgt: | Seite A: Startseite Seite K: Kontaktformular Seite P: Produkt-Eingangsseite Seiten P1 bis P6: Produktdetailseiten Seite S: Service Seite S1 bis S3 : Diverse Services-Beschreibungsseiten Seite N: News-Eingangsseite Seiten N1 bis N6: Diverse News-Seiten Die Startseite ist von allen Unterseiten erreichbar. Die Startseite linkt zu den Eingangseiten der 4 wichtigsten Themen (Produkte, News Services) und zusätzlich zur Kontakt-Seite. Die Seiten P, N und S (Produkte, News und Services) leiten den Besucher weiter zu den Themen spezifische Seiten ( P1 bis P6, N1 bis N6 und S1 bis S3 ). Während die News-Unterseiten außer N1 und die Service-Unterseiten außer S1 nicht von Seite N oder S erreichbar sind, bietet die Seite P einen direkten Zugriff auf alle Unterseiten P1 bis P6. Diese Struktur wurde beabsichtigt, um den Unterschied zwischen den Seiten P, S und N zu erkennen. Zusätzlich linken die Unterseiten P1 bis P6 zur Seite P und die Seiten N1 bis N6 zur Seite N. Im Gegensatz zur den Seiten S1 bis S3 die keine Links zur Seite S beinhalten. Weitere Beispiele im Tutorial auf der Webseite von selfoptimizer.com | |