ZU DEN KURSEN!

Search Engine Optimization - Termgewichtung (WDF*IDF)

Kursangebot | Search Engine Optimization | Termgewichtung (WDF*IDF)

Search Engine Optimization

Termgewichtung (WDF*IDF)

Früher gingen Suchmaschinenoptimierung bei der Erstellung von Texten nach einem einfachen Muster vor: der Text sollte zu 3-5% aus dem Suchbegriff bestehen. Das heißt, in 100 geschriebenen Worten sollte drei bis fünf Mal der zu optimierende Suchbegriff auftauchen. Man sprach dabei von der Keyworddichte (Keyword Density). Welche Werte hierbei ideal waren, war umstritten. In der Regel aber wurden Werte zwischen zwei und fünf Prozent angegeben.

Die Schwächen der Keyworddichte

Die Keyworddichte hat jedoch (mindestens) zwei fundamentale Schwächen:

  1. Sie beachtet nicht alle anderen Begriffe im Text. Wenn ein Text beispielsweise für "Golf" optimiert ist und eine Keyworddichte von 4% aufweist, hielt man das für ideal. Suchmaschinen sollten den Text so als relevant für "Golf" einordnen. Wenn aber im gleichen Text das Wort "Fußball" mit einer Keyworddichte von 6% vorkommt, wäre der Text für diesen Begriff noch relevanter. Das wurde stets vernachlässigt.
  2. Die reine Keyworddichte bezieht nicht die anderen Websites, die für diesen Begriff ranken, mit ein. Wenn alle Seiten in den Top 10 bzw. Top 100 für einen Begriff eine Keyworddichte von 6% aufweisen, die eigene Seite aber nur die (ideale) Dichte von 3%, wird sie als weniger relevant eingestuft. Umgekehrt: haben alle Seiten im Schnitt 2% und die eigene Seite 5%, könnte das schon als Spam-Signal gelten.

In den letzten Jahren wurde der Begriff der Keyworddichte daher von einer sehr viel exakteren Formel abgelöst. Dieser Trend ging vom deutschen Online-Marketer Karl Kratz aus, der die Wirksamkeit dieser Formel in zahllosen eigenen Beispielen unter Beweis gestellt hat.

Die Formel selbst ist dabei nicht neu, sondern stammt aus den 70er Jahren. Sie lautet (in der stark verkürtzten Form: WDF*p*IDF.)

WDF steht für "Within Document Frequency" und bezeichnet die Termgewichtung im eigenen Dokument (wobei daraus noch ein Logarithmus gebildet wird).

IDF ist die "Inverse Document Frequency" und bezieht sich auf alle anderen Dokumente in einer Untersuchungsmenge (meist die Top 10 oder Top 100 zu einem Suchbegriff).

P ist ein mathematischer Dämpfungsfaktor.

Die Formel bezieht also nicht nur die eigene Seite, sondern auch alle anderen relevanten Seiten mit ein. Was bringt das nun?

Durch die Formel erfahren Suchmaschinenoptimierer:

  • wie oft das Keyword im Text auftauchen sollte
  • welche anderen Begriffe im Text auftauchen sollten (semantisch verwandte Begriffe)
  • und wie oft diese jeweils auftauchen sollten.

Die Formel bzw. die Auswertung ist sehr komplex und lässt sich nur mit Hilfe von Tools durchführen. Am Markt existieren derzeit verschiedene Anbieter von kostenpflichtigen WDF/IDF-Tools, insbsondere:

  • Onpage.org
  • Seolyze.de
  • XOVI.de

Wie man mit der WDF/IDF-Formel arbeitet

Mit den entsprechenden Tools lässt sich analysieren, wie die bisher rankenden Websites Worte verwenden. Eine neue Website, die ebenfalls für einen bestimmten Begriff ranken wollen, sollten daher eine ähnliche Verteilung der Worte wählen.

Gibt man in das Seolyze-Tool das Keyword "Abiturvorbereitung" ein, erhält man folgende Auswertung.

WDF IDF Abiturvorbereitung

Die gelben Balken geben die durchschnittlichen Häufigkeiten des Keywords wieder, die rote Linie die maximale Ausprägung. Die schwarze Linie zeigt die Ausprägungen der Domain abiweb.de. Es emfpiehlt sich, sich möglichst gut an die gelben Balken anzunähern, die roten Grenzlinien jedoch nicht zu überschreiten (das könnte von den Suchmaschinen sonst als Spamsignal gewertet werden).

In den analysierten (also gut rankenden) Seiten kommt "Abiturvorbereitung" am häufigsten vor. Das sollte also auch bei abiweb.de der Fall sein, um den Suchmaschinen ein eindeutiges Signal zu senden. Die schwarze Linie zeigt, dass dies auch bereits der Fall ist.

Weitere Worte, die den Term "Abiturvorbereitung" quasi "beweisen", sind

  • Abitur
  • Mathematik
  • Deutsch
  • Englisch
  • Biologie
  • Musik
  • Angebote
  • Abi
  • etc.

Diese Begriffe sollten in absteigender Reihenfolge auch auf abiweb.de vorkommen. Die Auswertugn zeigt, dass die ersten drei Begriffe bereits gut optimiert sind. "Abi" kommt jedoch zum Beispiel überhaupt nicht vor. Dieser Begriff sollte ergänzt werden.

Semantik

Hinter dem Konzept der "Proof Keywords" steckt der semantische Zusammenhang zwischen Worten. Wenn Google eine Seite findet, die "behauptet", für den Begriff "Börse" relevant zu sein, erwartet Google, dass auf so einer Seite auch verwandte Begriffe wie "Aktien", "Wertpapiere" oder "KGV" vorkommen. Ist dies nicht der Fall (fehlen also wichtige Proof Keywords), sieht Google die Relevanz für den Begriff "Börse" als nicht gegeben an und wird die Seite entsprechend schlechter ranken.

Gleiches gilt im obigen Beispiel für "Abi". Auf einer Seite, die sich um "Abiturvorbereitung" dreht, erwartet Google scheinbar auch den Begriff "Abi". Fehlt dieser, sinkt in den Augen der Suchmaschine die Relevanz der Seite.