Kostenlose Erstberatung +49 (0)30 69 20 6347

Algorithmen

Wie bestimmte Algorithmen von Suchmaschinen genutzt werden können

Mittels eines Suchmaschinen-Algorithmus wird jeder Seite, für jeden auf dieser Seite vorkommenden Suchbegriff, ein Wert zugeordnet. Seiten, deren Relevanz zu einem bestimmten Suchbegriff höher ist, werden bei der Abfrage dieses Suchbegriffes auch höher gelistet.

Für die Relevanzbewertung verwenden die Suchmaschinen die verschiedensten Parameter.
Unter anderem:

Seiten-Interne Parameter

Suchworthäufigkeit in prägnanten Stellen wie:

  • Titel
  • Überschriften
  • Link-Texten
  • Dateinamen

Seiten-Externe Parameter

  • Link-Popularität (Anzahl der auf diese Seite verweisenden Links)
  • Qualität der externen Links (Pagerank)
  • Linktexte der externen Links (Anchor -Texte)

Je nach Suchmaschine werden diese Parameter unterschiedlich gewertet. Diese Bewertung wird im inversen Index mit gespeichert. Es fällt also auf, dass keine Suchmaschine einen einzelnen Algorithmus allein benutzt und wie schwer der einzelne Algorithgmus im Gesamtalgorithmus wiegt.

Zum Beispiel wird vermutet, dass die Suchmaschine Google über 60 Einzel-Algorithmen mit ständig wechselnder Gewichtung nutzt.
Würde der Gesamtalgorithmus bzw. die Gewichtung bekannt sein, so könnte sich die Suchmaschine einer Manipulation nicht mehr zur Wehr setzen und wäre somit sinnlos.

Eine weitere interessante Herangehensweise entwickelte die Firma DirectHit im Jahre 1998 und sie soll deswegen auch eine kurze Beschreibung wert sein.
Als Maß für das Ranking dient hierbei das Klickverhalten der Benutzer einer Suchmaschine. Die Klicks auf Suchergebnisse selber beeinflussen die Reihenfolge der Treffer. Klickten mehr Benutzer auf das dritte Ergebnis als auf das erste Ergebnis für eine Suchanfrage, so schien das dritte Ergebnis relevanter zu sein. Da Ergebnisse weit oben auf der ersten Suchergebnisseite sehr viel wahrscheinlicher angeklickt werden als Ergebnisse auf der zweiten Suchergebnisseite, bekommen die unteren Suchergebnisse einen größeren Bonus, wenn sie angeklickt werden, als die oberen.

Darüber hinaus wird die Zeit gemessen, die ein Benutzer auf einer Seite verbracht hat, zumindest dann, wenn er zurückkehrte und auf ein anderes Ergebnis klickt. Heute gehört DirectHit zu Teoma und damit zu Ask Jeeves.
Es ist jedoch nicht sicher, ob dieses Vorgehen mittlerweile nur noch zur Analyse von Surfverhalten von Nutzern genutzt wird, als zu Ermittlung von Rankingplätzen von Suchergebnissen.

Es folgen nun drei etwas tiefer gehende Erläuterungen zu den wahrscheinlich wichtigsten Suchmaschinen-Algorithmen.
Ich sehe davon ab eher triviale Suchmaschinenalgorithmen zu beleuchten, die sich mit seiten-internen Parametern beschäftigen und anhand der Suchworthäufigkeit an prägnanten Stellen der Internetpräsenz das Ranking bestimmen.
Auf diesen Algorithmen beruhten hauptsächlich Suchmaschinen der älteren Generation (vor 1998). Sie waren mutwilligen Manipulationen und dem rasanten Anwachsen des Internets nicht mehr gewachsen.

Das Ranking wurde von Google wie folgt benutzt:

  • Alle Seiten finden, die zum Suchbegriff passen
  • Ranking entsprechend den Seitenfaktoren, also dem Vorkommen des Suchbegriff in Seitentext bzw. Titel
  • Berücksichtigung des Ankertextes der externen Seiten
  • Regulieren der Ergebnisse nach dem PageRank Verfahren

Der Algorithmus wurde von Larry Page (daher der Name PageRank) und Sergey Brin an der Stanford University entwickelt und von dieser patentiert. Er diente Google, dem von Brin und Page gegründeten Unternehmen, als Grundlage für die Bewertung von Seiten.
Und dies mit Erfolg. Google ist heute der unumstrittene Marktführer in Sachen Suchmaschine.