SEO Mythos Keyword Density

Die “Keyword Density” (deutsch: Suchbegriff-Dichte oder Schlüsselwort-Dichte) ist einfach zu verstehen, leicht zu berechnen und simpel in der Analyse.

Ich begehe heute mal digitalen Selbstmord, indem ich ganz platt sage: Wer mit dem Faktor “Keyword Density” arbeitet, hat SEO nicht verstanden. Danke für Deine Aufmerksamkeit. :-)

Der Schutz Deiner Daten ist mir wichtig!

Ich respektiere Deine Privatsphäre. Deshalb habe ich die Datenerfassung auf dieser Website auf ein Minimum reduziert.

Achtung: Wenn ich nicht weiß, was Du schon alles von mir kennst, zeige ich Dir möglicherweise lauter Zeug, das Du schon kennst. Das ist doof, weil es unnötig ist.

Wenn Du mir eine kleine Chance für das Tracking lässt, reduzierst Du für Dich unnötige Werbung - und ich kann meine Inhalte weiter verbessern! :-)

Klingt das nach einem guten Deal?

Ich erlaube den Einsatz von Cookies und stimme dem Tracking mittels Google Analytics sowie dem Facebook Tracking Pixel gemäß der Datenschutzerklärung zu.

Hinweis: Diese Einstellungen kannst Du jederzeit auf der Datenschutz-Seite widerrufen.

Raus aus den Kinderschuhen

Es vergeht kaum ein Tag, an dem ich nicht über irgend eine Aussage bezüglich der “optimalen Keyword-Dichte für Webseiten” stolpere. Manche schwören auf einen Wert zwischen 3% und 5%. Andere sind sich sicher, dass ab einer Schlüsselwort-Dichte von 7% Google die Suchmaschinen die Seite als Spam abstrafen. Wieder andere sind mutiger und behaupten, dass eine Keyword-Dichte bis 12% vollkommen in Ordnung sei. Hm. Schauen wir uns mal die Mathematik dahinter an.

Die vereinfachte Berechnung der Keyword Density sieht so aus:

Keyword Density ist Bullshit. — Keyword Density » Berechnung

Mit Hilfe dieser Formel kann die Keyword Density eines gegebenen Dokuments berechnet werden: kd steht für die Keyword Density. Die Keyword Density wird als Quotienten aus der Termfrequenz tf und der Termanzahl l berechnet. Die Termfrequenz tf(u,v) gibt an, wie oft der Term u im gegebenen Dokument v vorkommt. Die Termanzahl l(u) gibt an, wieviele Terme insgesamt im Dokument v vorkommen.

Das ist schön einfach … und aus mathematischer Sicht schlicht unnütz. Abgesehen davon sähe die sauberste Lösung eigentlich so aus:

Die Erweiterung der Berechnung ist dem Umstand geschuldet, dass die Anzahl der Einzelterme innerhalb des zu analysierenden Term größer als “1″ werden kann (z.B. bei einer zwei- oder drei-Wort-Kombination). In diesem Fall würde die Gesamtanzahl der zu analysierenden Terme im Dokument verfälscht werden.

Das Gute ist: Selbst diese (genauere) Berechnung ist genauso unbrauchbar. ;-)

Für die Mümümüs unter meinen Lesern: Nur ein einziges Signal

Dieser Artikel behandelt nur ein einziges Signal, welches mit hoher Wahrscheinlichkeit einen relevanten Ranking-Faktor in Suchmaschinen darstellt. Für eine umfassende Betrachtung einer Website sind selbstverständlich viele unterschiedliche Signale für die Bewertung zu betrachten. Sodele, jetzt zurück zum roten Faden.

Für die Praxis: Wir brauchen einfache Werte

“Bitte erstellen Sie einen Text zum Keyword ‘Risikolebensversicherung Vorteile’ mit einem Umfang von 300 Worten und einer Keyword-Density von 3%.”

So und ähnlich lauten die Textaufträge, die täglich auf Textbroking-Plattformen vergeben werden. Ein versierter Texter weiss nun sofort, was zu tun ist: Er erstellt einen Text mit 300 Worten und führt neun mal den Term “Risikolebensversicherung Vorteile” auf.

Prompt stellen sich Fragen wie:

Wenn das Dokument aus 300 Wörtern besteht, kommt das Schlüsselwort 9 mal darin vor. Aber: Mit welcher Keyword-Density kommen andere Terme im Dokument vor?
Je nach Verfahren zählen die Schlüsselwörter im Titel und der Description mit – oder auch nicht. Erfährt die Keyword Density im Title eine andere Gewichtung als im Text? Wird zwischen Überschriften und Fließtext differenziert?
Schlüsselwort-Kombinationen, die nicht unmittelbar aufeinander folgen, werden nicht mit berücksichtigt. Unterstützt mein Keyword Density Algorithmus Methoden um Proximity / Anti-Proximity der Terme zu berücksichtigen?
und so weiter …

Damit macht eine Aussage zur Keyword Density über das Resultat, welches in der Datenbank der Suchmaschine landet, definitiv keinen Sinn mehr. Doch es gibt auch noch eine simple mathematische Beweisführung:

Die Keyword-Density ist rein mathematisch ein irrelevanter Wert

Jens Fauldrath steuerte in den Kommentaren bereits einen lesenswerten Link dazu bei: “Das Cosinus-Maß im Information Retrieval“. Ich habe gemeinsam mit Jana Engelmann die mathematische Herleitung in diesem kleinen Ebook aufgeführt, damit es nachvollziehbarer wird:

Fuck keyword density — Kill keyword density

Download: Ebook “Kill Keyword Density” (2012 Karl Kratz / Jana Engelmann). Für die Lektüre kann ein wenig Know-How zum Thema Vektorrechnung nicht schaden. ;-)

“Des hemmer scho emmer so gmacht.”

“Soll der Kratz doch schreiben, was er will. Wegen diesem Online-Kasper werden wir unsere Tools, Oberflächen und Algorithmen nicht ändern.”

Wer so drauf ist, sollte wenigstens noch diesen Absatz hier lesen. Und dann nochmals nachdenken, ob er sein Investitionsverhalten für die Zukunft nicht doch überdenken möchte …

Hier geht es weiter ...

Der Artikel Termgewichtung w = WDF * IDF ist deutlich intensiver, als der Rest dieses Artikels. Bitte lies dort weiter, danke :-)

Juchu – mit WDF*IDF wird die Onpage-Suchmaschinenoptimierung doch zum Kinderspiel!

Die Aufgabe wäre also relativ einfach:

Analysiere eine ausreichende Menge an Mitbewerber-Websites hinsichtlich des oberen Grenzwerte für die WDF*IDF-Faktoren der wichtigsten Terme.
Erstelle daraus die Vorgaben für die Texte des jeweiligen Internet Angebots
Nimm die Texte, setze die restlichen 70 Onpage-Faktoren um und …

… Tadaaaa, fertig!

Naja, so leicht ist es leider nicht – immerhin haben Suchmaschinen in den letzten Jahren einiges an “Erfahrung” gewonnen und in die Algorithmen implementiert. Das bedeutet, dass nun die Arbeit eigentlich erst richtig losgeht. Folgende Parameter möchten ebenfalls analysiert, ausgewertet und angewandt werden:

Schlüsselwort-Abstand (Proximity und Anti-Proximity)
Schlüsselwort-Verteilung innerhalb des Dokuments
Häufung des Schlüsselworts in besonderen Bereichen
Einsatz des Schlüsselworts in SEO-relevanten Bereichen wie Title-Tag, Description, Überschriften, Fettschrift, Listen, Bilder, Fliesstext und Links
Einsatz artverwandter Schlüsselwörter zur “Festigung” des Textes mit Blick auf die personalisierte Suche

Übrigens: Über die hier beschriebenen Methoden lässt sich trefflich streiten – das ist ein wenig so, als ob jemand eine technische Chartanalyse als Grundlage für seine nächste Investitionsentscheidung in Aktien trifft. Grauenhaft, nicht? 50% der Leser wiederum finden diese Methode gut … Aber am allerwichtigsten: Gute Inhalte für Benutzer schreiben, nicht für Suchmaschinen, gell? ;-)

Ich wünsche Dir eine wilde Zeit,

Karl

Weiterführende Links:

Das Cosinus-Maß im Information Retrieval http://information-retrieval.de/irb/ir.part_1.chapter_3.section_6.topic_5.subdiv1_2.html
Within-Document-Frequency (Wikipedia) http://de.wikipedia.org/wiki/Within-document_Frequency

Keyword Extraction from a Single Document using Word Co-occurrence Statistical Information http://goo.gl/cn5f (nicht mehr vorhanden)
Term Frequency – Inverse Document Frequency http://goo.gl/QcGn

So viele Goldnuggets für Dein Online-Marketing!

Mit diesem kostenfreien System entwickelst Du schlauere Online-Strategien, exzellente Inhalte und verbesserst Deine digitale Findbarkeit!