Kostenlose Erstberatung +49 (0)30 69 20 6347

IDF= Inverse Document Frequency und Suchmaschinen-Optimierung

von Rainer Meyer

Wichtig für das Ranking einer Website ist die On-Page-Optimierung, also das angemessene Platzieren von Keywords im Titel, in der Überschrift und in weiteren Seitenbestandteilen, insbesondere im normalen Seitentext. Am besten man sorgt dafür, dass etwa zwei bis drei Keywords besonders häufig vorkommen, aber die restlichen Begriffe im Text einen eher sehr geringen Anteil haben.

Der Grund für das Herunterschrauben der nicht relevanten Begriffe ist die sogenannte IDF, die Inverse Document Frequency (oder auf Deutsch die inverse Dokumentenhäufigkeit) eines Begriffes.

Beispielsweise sollte ein Text, der für die Begriffe „Trainer“ und „Bonn“ optimiert wird, möglichst nicht andere Begriffe wie „Coach“ oder „Köln“ häufig enthalten. Aus der Sicht einer Suchmaschine wie Google sollte ein Text bestimmte Begriffe mit einer gewissen Häufigkeit enthalten, wenn der Text für diese Begriffe wichtig ist; andere Begriffe, die auch sehr häufig vertreten sind, schmälern dann die Wirkung dieser Begriffe.

Die Festlegung macht in bestimmten Fällen sicher Sinn, denn wenn ein Text sehr oft, die Begriffe Köln und Bonn enthält, dann ist es unwahrscheinlich, dass sich der Text in zentraler Weise mit Bonn beschäftigt. Eine andere Einschätzung kann man aber entwickeln, wenn es sich um synonyme Begriffe wie Trainer oder Coach geht.

Es deutet zwar viel darauf hin, dass Google und Co. immer besser synonyme Begriffe bestimmen können, doch ist man dann auf der sicheren Seite, wenn man für diese Begriffe eine eigene Webseite erstellt, die für den synonymen Begriff optimiert ist (und den ursprünglichen Begriff eher vermeidet).

Wie die inverse Dokumentenhäufigkeit genau berechnet wird, kann man hier nachlesen: http://de.wikipedia.org/wiki/Inverse_Dokumenth%C3%A4ufigkeit. Allerdings hilft diese Formel in der Praxis nicht viel weiter. Besser ist, wenn man zunächst beim fertigen Text untersucht, welche Begriffe überhaupt mit welcher Prozentzahl vorkommen. Stopwörter wie „und“ oder „in“ braucht man nicht zu berücksichtigen, weil diese nicht in die Keyword-Berechnung eingehen.

Ideal wäre es, wenn zwei oder drei Wörter mit einer Häufigkeit von etwa 4 bis 5 % vorliegen und wenn alle weiteren Wörter deutlich weniger Anteil als ein Prozent hätten. Denn dann würde der Text genau für diese häufigen Begriffe gerankt werden, während er kaum durch andere Begriffe „belastet“ ist.

Warum zwei bis drei Wörter? Weil es im Sinne der Nischen-Strategie schwierig ist, für ein Wort einen guten vorderen Platz im Ranking zu bekommen. Mehr als drei Keywords sollten es auch nicht sein, denn dann wird die Nische zu eng.

Warum etwa 4 bis 5 %? Dies ist ein Erfahrungswert, den Suchmaschinen-Optimierer häufig nennen. Die Erfahrung spricht dafür, dass höhere Werte als Keyword-Stuffing zur Abstrafung führen.

Warum der Rest unter einen Prozent? Diese Zahl habe ich eher intuitiv  bestimmt. Wichtig ist vor allem, dass außer den zwei bis drei geförderten Keywords keine weiteren Begriffe an Gewicht gewinnen.

Schreibe einen Kommentar