Die “Keyword Density” (englisch für Schlüsselwort-Dichte oder Suchwortdichte) ist in aller Munde. Doch kaum ein anderer SEO Faktor wird so oft missverstanden wie die Keyword Density. Warum das so ist – und wie man diesen äusserst wichtigen SEO Faktor sinnvoll einsetzen kann, lesen Sie in diesem Posting.
Liebe Leserinnen und Leser,
es vergeht kaum ein Tag, an dem ich nicht über irgend eine Faustformel bezüglich der “optimalen Keyword-Dichte” in Webseiten stolpere. Manche schwören auf einen Wert zwischen 3% und 5% und sind sich sicher, dass ab einer Schlüsselwort-Dichte von 7% Google die Suchmaschinen die Seite als Spam abstrafen. Andere wiederum sind mutiger und meinen, dass eine Keyword-Dichte bis 12% vollkommen in Ordnung sei.
Als kleiner Einstieg zunächst die Keyword Density aus der trockenen, mathematischen Sicht:

Mit Hilfe dieser Formel kann die Keyword Density eines gegebenen Dokuments berechnet werden. kd steht für die Keyword Density. Die Keyword Density wird als Quotienten aus der Termfrequenz tf und der Termanzahl l berechnet. Die Termfrequenz tf(uv) gibt an, wie oft der Term u im gegebenen Dokument v vorkommt. Die Termanzahl l(v) gibt an, wieviele Terme im Dokument v vorkommen.
Deshalb sagt die Keyword Density überhaupt nichts aus
Eine Aussage über die Keyword Density eines Dokuments als isolierter Wert macht aus mehreren Blickwinkeln keinen Sinn. Das lässt sich an einem einfachen Beispiel bereits verdeutlichen: Ein gegebenes Dokument v hat eine ermittelte Keyword Density von 8%. Das lässt nun mehrere Rückschlüsse zu:
- Wenn das Dokument aus 100 Wörtern besteht, kommt das Schlüsselwort 8 mal darin vor (Frage: Mit welcher Dichte kommen andere Wörter im Dokument vor?)
- Besteht das Dokument aus 1000 Wörtern, kommt das Schlüsselwort sogar 80 mal darin vor (Frage: Wie viele Wörter umfasst das Dokument eigentlich?)
- Je nach Verfahren zählen die Schlüsselwörter im Titel und der Description mit – oder auch nicht (Frage: Erfährt die Keyword Density im Title eine andere Wichtung als im Text?)
- Schlüsselwort-Kombinationen, die nicht unmittelbar aufeinander folgen, werden nicht mit berücksichtigt (Frage: Unterstützt mein Keyword Density Algorithmus Proximity / Anti-Proximity Messmethoden?)
- und so weiter …
Gleichzeitig durchläuft das HTML-Dokument im Rahmen des Information Retrieval-Prozesses (Linearisierung, Tokenisierung, Filterung, Stemming und Gewichtung) eine komplette textuelle Modifikation. Eine sehr gut aufbereitete Erläuterung hierzu finden Sie im Artikel “Document Indexing Tutorial” von Dr. Garcia.

Damit macht eine Aussage zur Keyword Density über das Resultat, welches in der Datenbank der Suchmaschine landet, definitiv keinen Sinn mehr. Also brauchen wir zusätzlich zur Schlüsselwort-Dichte noch weitere Informationen. Ein guter Einstieg sind die Faktoren Termfrequenz, inverse Dokumenthäufigkeit und die Gewichtungsmethode TF-IDF. Abhandlungen (z.B. http://de.wikipedia.org/wiki/TF-IDF ) gibt es dazu viele, daher behandle ich die Punkte auch nur kurz.
Keyword Density + Termfrequenz
Die Termfrequenz stellt die Anzahl der Terme (Schlüsselwörter) dar. Damit ist die Termfrequenz ein erster Anhaltspunkt für die Bedeutung dieses Terms für dieses Dokument.
Es ist eine banale, aber wichtige Aufgabenstellung für die Suchmaschinenoptimierung: Wie oft kommt ein Term im gegebenen Dokument vor?
Inverse Dokumenthäufigkeit
Die inverse Dokumenthäufigkeit ist ein Faktor, um die Bedeutung eines Terms in Bezug auf die Gesamtmenge aller betrachteten Dokumente darzustellen. Je mehr Dokumente es also zu einem Schlüsselwort gibt, umso “schwieriger” wird die Erzeugung von Relevanz.
Die Gewichtungsmethode TF-IDF
tf-idf (term frequency – inverse document frequency) ist eine Gewichtungsmethode für Terme (Schlüsselwörter) beim Information Retrieval. Die term frequency (Termfrequenz) in einem gegebenen Dokument gibt einen Hinweis auf die Bedeutung dieses Terms für das Dokument. Die inverse document frequency (Inverse Dokumenthäufigkeit) misst die allgemeine Bedeutung des Terms für die Gesamtmenge der betrachteten Dokumente.
Ab welcher Keyword Density ist ein Text Spam?
Es macht kaum Sinn, hier eine pauschale Aussage zu treffen – es hängt schlicht vom Schlüsselwort ab. Und diese Werte wiederum lassen sich aus gut rankenden Websites ermitteln. Führen Sie eine Suchmaschinenabfrage für ein Schlüsselwort durch und ermitteln Sie
- die Keyword Density
- die Termfrequenz sowie
- die Termanzahl
der ersten 10, 50 oder gar 100 Suchmaschinenresultate. Diese Werte können Sie in der Regel losgelöst vom Ranking der jeweiligen Webseite durchführen – es geht hier nur um die Ermittlung der durchschnittlichen sowie der unteren und oberen Grenzwerte.
Was ist wichtiger als die Keyword Density?
Wichtiger als die absolute Keyword Density ist die Verteilung der relativen Keyword Density innerhalb eines Dokuments. Die relative Keyword Density innerhalb eines Dokuments gibt das deutlichste Signal und die eindeutigste Aussage über den Inhalt des gegebenen Dokuments.
Ich möchte das gerne an einem Beispiel aus meinem Website-Labor verdeutlichen. Hierzu verwende ich eine sinnvoll rankende Website und führe eine Keyword Density Analyse mit ein, zwei und drei Termen aus. Dazu verwende ich das Keyword Density Tool von SEOQuake (hat zwar seine kleinen Fehlerchen, aber generell ein wirklich empfehlenswertes Werkzeug!).
Das Resultat der Auswertung gibt ziemlich deutlich wieder, um was es sich thematisch auf dieser Website handelt. Zuerst die Analyse mit nur einem Term:
Klar abgegrenzt vom Rest mit einer Keyword Density von 6% das Schlüsselwort “Kredit”. Dabei wurde darauf geachtet, dass das Schlüsselwort “Kredit” an der oberen Grenze der auf Mitbewerber-Webseiten ermittelten Termfrequenz und Wortanzahl ausgerichtet ist. Danach folgende die zusätzlichen Schlüsselwörter “trotz” und “Schufa” mit einer eindeutig hohen Keyword Density. Schon jetzt kann man als Mensch eine Aussage darüber treffen, um was es wohl in diesem Dokument geht. Danach folgen Stopwörter, die ohnehin entfernt werden.
Die Analyse der Kombination mit zwei Termen verdeutlicht die thematische Ausrichtung: “trotz Schufa” dominiert – wünschenswert wäre es gewesen, wenn “kredit trotz” an erster Stelle stehen würde. Hier ist also noch ein wenig Optimierungs-Potential.
Ich gehe zwar erst später im Dokument auf das Thema “artverwandte Keywords” ein, aber man erkennt schon erste Zusammenhänge zwischen “Schufa” und “Auskunft”, welche hier bewusst eingesetzt wurden. Als Arbeitsmittel kann zum Beispiel das Google Wunderrad verwendet werden. Im Artikel “16 empfehlenswerte Keyword Tools” finden Sie eine ganze Reihe an Werkzeugen für Ihr Vorhaben.
Nun aber zurück zum roten Faden: Die Analyse mit 3 Termen zeigt einen deutlichen Unterschied zwischen der Keyword Density der Kombination “kredit trotz schufa” und den restlichen Schlüsselwort-Kombinationen:
Juchu – damit wird die Onpage-Suchmaschinenoptimierung doch zum Kinderspiel!
Die Aufgabe wäre also relativ einfach:
- Führe eine Suchmaschinenabfrage für ein Schlüsselwort durch
- Analysiere eine ausreichende Menge an Mitbewerber-Websites hinsichtlich der Termanzahl, Termfrequenz und der relativen Keyword-Density um die oberen Grenzwerte zu ermitteln
- Erstelle daraus die Vorgaben für die Texte des jeweiligen Internet Angebots
- Nimm die Texte, setze die restlichen 70 Onpage-Faktoren um und …
… Tadaaaa, fertig!
Naja, so leicht ist es leider nicht – immerhin haben Suchmaschinen in den letzten Jahren einiges an “Erfahrung” gewonnen und in die Algorithmen implementiert. Das bedeutet, dass nun die Arbeit eigentlich erst richtig losgeht. Folgende Parameter möchten ebenfalls analysiert, ausgewertet und angewandt werden:
- Schlüsselwort-Abstand (Proximity und Anti-Proximity)
- Schlüsselwort-Verteilung innerhalb des Dokuments
- Häufung des Schlüsselworts in besonderen Bereichen
- Einsatz des Schlüsselworts in SEO-relevanten Bereichen wie Title-Tag, Description, Überschriften, Fettschrift, Listen, Bilder, Fliesstext und Links
- Einsatz artverwandter Schlüsselwörter zur “Festigung” des Textes mit Blick auf die personalisierte Suche
Übrigens: Über die hier beschriebenen Methoden lässt sich trefflich streiten – das ist ein wenig so, als ob jemand eine technische Chartanalyse als Grundlage für seine nächste Investitionsentscheidung in Aktien trifft. Grauenhaft, nicht? 50% der Leser wiederum finden diese Methode gut … Aber am allerwichtigsten: Texte für Benutzer schreiben, nicht für Suchmaschinen, gell? ;-)
Links
- Keyword Extraction from a Single Document using Word Co-occurrence Statistical Informationhttp://goo.gl/cn5f
- Term Frequency – Inverse Document Frequencyhttp://goo.gl/QcGn
- Topic Analysis Using a Finite Mixture Modelhttp://goo.gl/kkjl
- Implementation and Application of Term Weights in a MySQL Environmenthttp://goo.gl/8ohe
- Improving the Effectiveness of Informational Retrieval with local context analysishttp://goo.gl/OZjt





Mein Name ist Karl Kratz. Seit 1998 lässt mich das Thema Online-Marketing nicht mehr los. Das ist ganz praktisch für Sie als Leser. Dabei kommt nämlich viel Lesestoff zusammen: 
Pingback: uberVU - social comments
Hallo! Nach dem Lesen des Artikels stelle ich mir die Frage wie man in Zukunft Autoren anweisen soll Texte zu verfassen. Ich habe in den letzten Tagen mal einige Texte bei http://www.content.de/ in Auftrag gegeben. Da kann man für jedes Keyword eine eigene Keyworddichte in Prozent vorgeben, die der Autor berücksichtigen soll. Die Stellen wo die Keywords integriert werden, kann man jedoch nicht vorgeben. Das macht der Autor “aus dem Bauch” heraus. Was meint Ihr?
Beste Grüße
Uli
Sehr ausgereifter und gut recherchierter Artikel. Ich kann die Kern Aussage bestätigen, es gibt keine definitiven Prozentzahlen und Grenzen dahingeghend was zuviel oder zu wenig Keywords sind.
Ähnlich der SEO Quake Toolbar möchte ich das auf unserer Webseite zu findende Keyword Analyse Tool empfehlen, um die Keyword Density zu ermitteln. Hierbei wird auch das Auftauchen eines Keywords in der URL berücksichtigt.
Pingback: Onlinemarketing › Suchmaschinenoptimierte Texte
Sehr guter Artikel zu diesem Thema. Als SEO-Anfänger finde ich das Tool SEO-Quake sehr hilfreich, danke für die Empfehlung. Die Optimierung des Content ist also doch nicht eine “soooo” einfache Angelegenheit. Welche Frage sich mir stellt ist “In wie weit beziehen die Suchmaschinen das Alter des jeweiligen Content oder Artikel mit in das Ranking ein?”
Pingback: Top 10 der Woche 16/10 « Wochenrückblicke
Pingback: Die 8 beliebtesten #Onlinemarketing + #SEO Artikel
Pingback: Website SEO
Thanks for good information that comes out to
read.
Pingback: Landingpage SEO
Sehr nützliche Informationen. Das ist ein Thema in das ich mich bald leider einarbeiten muss.
Danke für diese super Tipps.
A good article Thank you!
Der beste Artikel zum Thema Keyword Density den ich bis jetzt gefunden habe ;)