Um in den Suchergebnissen von Google eine gute Platzierung zu erzielen, ist es wichtig, Duplicate Content zu erkennen und zu eliminieren. Denn der Google-Algorithmus bestraft bestimmte Methoden und Praktiken besonders hart, und Duplicate Content gehört dazu. Hierbei handelt es sich nämlich um Inhalte, die fast gleich sind und auf unterschiedlichen URLs erscheinen. Das Problem dabei ist, dass identische Inhalte, die über mehrere Seiten erreichbar sind, sich negativ auf das Ranking in den Suchmaschinen auswirken können.

Definition 

Duplicate Content (DC) bezieht sich auf Inhalte, die dieselben Informationen enthalten und über verschiedene Seiten zugänglich sind. Dabei unterscheidet man zwischen zwei Arten von Duplicate Content: internen DC, der auf derselben Website vorkommt, und externen DC, der auf verschiedenen Domains zu finden ist. Da doppelte Inhalte ein negatives Nutzererlebnis verursachen, straft Google URLs mit DC durch eine verringerte SEO-Performance ab – sofern er nicht explizit gekennzeichnet wurde.

Was ist Duplicate Content?

Wenn größere Abschnitte oder sogar die gesamte Webseite kopiert und auf einer anderen Seite veröffentlicht werden, entsteht sog. Duplicate Content. Da nun identischer Content an mehreren Orten vorhanden ist, kann die Suchmaschine nicht entscheiden, welche Version des Inhalts die relevanteste ist und im Suchmaschinenranking bevorzugt angezeigt werden soll. Aus diesem Grund ist es wichtig, dass Webmaster duplizierten Content immer ernst nehmen!

Denn Suchmaschinen streben danach, den Nutzern präzise Suchergebnisse zu liefern, um eine bestmögliche „User Experience“ zu bieten. Ergebnisse mit gleichem Content werden bei Suchanfragen selten angezeigt. Stattdessen ist die Suchmaschine gezwungen, eine Version auszuwählen, die am besten zu den Suchkriterien passt.

Ab wann ist es Duplicate Content?

Doch nicht jeder identische Satz ist automatisch Duplicate Content. Wenn beispielsweise Zitate verwendet werden und diese im Quelltext als solche gekennzeichnet sind, bewertet Google dies nicht als identischen Inhalt. Ebenso wird Content in unterschiedlichen Sprachen in der Regel nicht als DC gewertet, solange keine unterschiedlichen Domains bestehen.

Allerdings entsteht Duplicate Content, wenn große Teile einer Seite kopiert und auf einer anderen URL eingebaut werden, denn Google erkennt „unfaire Praktiken“ (siehe Blackhat SEO).

Ursachen für Duplicate Content

Einige Ursachen wie Duplicate Content entstehen kann sind:

Interner Content

Interner Content kann entstehen, wenn derselbe Inhalt auf unterschiedlichen Unterseiten innerhalb derselben Webseite  besteht. Dies passiert in der Regel  unbeabsichtigt, z. B. durch Beiträge und Seiten, die mehreren Kategorien zugeordnet werden. Dadurch entstehen verschiedene Linkstrukturen, die letztendlich alle zum selben Produkt führen. Besonders Online-Shops mit vielen Unterseiten und Kategorien sind häufig von internem Duplicate Content betroffen.

Externer Content

Externer Duplicate Content tritt auf, wenn dieselben Inhalte auf verschiedenen Domains erscheinen. Externer DC kann entweder durch eigenes Verschulden oder durch fremdes Verschulden entstehen. Eigenverschulden kann beispielsweise versehentlich vorkommen, wenn Unternehmen z.B. verschiedene Online-Projekte auf unterschiedlichen Domains betreuen und  dieselben Mitteilungen auf den jeweiligen Webseiten veröffentlichen. Fremdes Verschulden kann wiederum durch Content-Diebstahl entstehen. In diesem Fall erscheint Ihr einzigartiger Inhalt plötzlich auf einer fremden Domain. Das ist problematisch, denn nun kann der Google-Algorithmus möglicherweise nicht mehr das Original erkennen, da beide Webseiten indexiert werden.

Weitere Ursachen

  • Bei Kooperationen mit anderen Unternehmen besteht die Möglichkeit, dass beide Parteien die Inhalte rechtmäßig auf ihren eigenen Seiten veröffentlichen. Dadurch entsteht ebenfalls externer Duplicate Content.
  • Variationsseiten sind eine weitere potenzielle Quelle für DC. Wenn es viele Detailseiten gibt, die sich nur in Größe oder Farbe eines Produkts unterscheiden, kann dies zu ähnlichen Inhalten führen.
  • Bei der Erstellung von druckerfreundlichen Seiten kann es zu Problemen mit Duplicate Content kommen. 
  • PDF-Unterseiten werden von vielen Website-Betreibern verwendet, insbesondere bei komplexen Produkten, um zusätzliche Produktbeschreibungen und Informationen bereitzustellen. Es ist jedoch wichtig sicherzustellen, dass diese Informationen bereits auf der Produkt-Landingpage vorhanden sind, um DC zu vermeiden.
  • Von Content-Management-Systemen (CMS) generierte Seiten können ebenfalls Duplikate verursachen, zum Beispiel durch Link-Endungen wie „/de/“.
  • Auch verschiedene URLs, die zum gleichen Ziel führen, können zu Duplicate Content führen. 

Warum ist Duplicate Content ein Problem?

Diese Probleme können bei doppelten Inhalten entstehen:

  1. Duplizierte Inhalte stehen im Widerspruch zum Grundprinzip des Content-Marketings, nämlich der Einzigartigkeit (Uniqueness). Sie bieten den Nutzern keinen Mehrwert, da sie nicht einzigartig sind. 
  2. Suchmaschinen sind unsicher, welche Version der Seite indexiert werden soll.
  3. Suchmaschinen können nicht feststellen, welche Version der Seite relevant für die Suchergebnisse ist.
  4. Die Zuweisung der Link Authority wird erschwert, wenn zwei verschiedene URLs auf den gleichen Inhalt verweisen.

Wie vermeiden Sie Duplicate Content?

Sie können DC vermeiden, indem Sie folgende Punkte einhalten:

  • Erstellen Sie einzigartige und originelle Inhalte: Investieren Sie Zeit und Ressourcen in die Erstellung hochwertiger Inhalte. Ihr Content sollte stets einzigartig sein und Ihrer Zielgruppe einen Mehrwert bieten.
  • Nutzen Sie Canonical-Tags bei ähnlichen Seiten oder Varianten desselben Inhalts. Mithilfe von Canonical-Tags können Sie Suchmaschinen mitteilen, welche Seite sie als präferierte Version betrachten sollen.
  • Wenn Sie alte Seiten löschen oder umstrukturieren, richten Sie 301-Weiterleitungen ein, um sowohl Besucher als auch Suchmaschinen auf die richtige Seite umzuleiten.
  • Vermeiden Sie unbedingt Scraping und Content-Diebstahl! Achten Sie immer darauf, dass Ihre Inhalte nicht von anderen Webseiten kopiert und ohne Erlaubnis veröffentlicht werden. Überwachen Sie regelmäßig das Internet auf Plagiate Ihrer Inhalte.
  • Nutzen Sie Robots.txt und Meta-Tags: Durch die Verwendung von Robots.txt-Dateien und Meta-Tags können Sie Suchmaschinenanweisungen geben.

Wie überprüfen Sie Duplicate Content?

Nutzen Sie bestimmte Tools und Anwendungen, um DC zu vermeiden:

Google Search Console

Auch die Google Search Console zeigt Ihnen, welche Seiten als Duplikate angezeigt werden: 

  1. Öffnen Sie die Google Search Console und wählen Sie die zu überprüfende Website aus.
  2. Klicken Sie auf „Indexierung“ in der linken Seitenleiste unter der Kategorie „Seiten“.
  3. Hier sehen Sie eine Übersicht über die Seiten, die Google indexieren kann und welche eventuell ausgeschlossen wurden.
  4. Klicken Sie dazu auf das Diagramm, das „Nicht indexiert“ anzeigt, um diese Seiten im Detail zu sehen.

Nun können Sie einsehen, welche Seiten von Google ausgeschlossen wurden und warum. Wenn Duplicate Content erkannt wurde, sollte dies in den Informationen angezeigt werden. Die Search Console bietet Ihnen auch weitere Tools und Berichte, um Probleme mit DC zu erkennen und zu beheben.

Siehe auch: