Zum Inhalt springen

Content Diebstahl erkennen und bekämpfen

Wenn die eigene Webseite urplötzlich im Google Ranking abstürzt und man weder eine Nachricht in den Google Webmastertools findet, noch sonst eine Ursache ausmachen kann, könnte Duplicate Content (also doppelter Inhalt) ein Ansatzpunkt sein. Google mag es überhaupt nicht, wenn Inhalt auf mehreren Seiten in identischem Wortlaut auftaucht. Doch wie kann man feststellen, ob und wo sich der doppelte Inhalt befindet oder ob man gar ein Opfer von Contendiebstahl geworden ist?

Doppelten Inhalt finden und beseitigen

Wer überprüfen möchte, ob Duplicate Content für seinen Webauftritt vorhanden ist, kann zunächst auf kostenfreie Tools wie z.B. seitenreport.de zurückgreifen. Diese Tools liefern zwar keine Details, eignen sich aber hervorragend zur schnellen Überprüfung. Wird hier bereits Duplicate Content festgestellt, sollte als nächstes getestet werden, ob die eigene Seite mit und ohne „www.“ erreichbar ist (www.meineseite.de / meineseite.de). Ist dies tatsächlich der Fall, bietet es sich an, eine der beiden Varianten auf die andere umzuleiten. Dieses wird durch folgenden Eintrag in der .htaccess Datei umgesetzt:

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.
RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,QSA,L]

Im obigen Beispiel wird also meineseite.de auf www.meineseite.de umgeleitet. Dadurch wird sichergestellt, dass Google keinen doppelten Content innerhalb der eigenen Domain findet. Doch was ist mit selbst geschriebenen Inhalten, die ohne mein Wissen auf fremden Webseiten veröffentlicht werden? Dieser Art des Duplicate Content ist etwas schwerer auf die Schliche zu kommen. Dabei muss natürlich auch unterschieden werden, ob es sich um eine autorisierte Veröffentlichung handelt oder ob es um Content Diebstahl geht.

Ein sehr einfaches Tool, um dies herauszufinden, ist copyscape. Dabei handelt es sich um eine Art Suchmaschine, die den Inhalt von Webseiten miteinander vergleicht und dem Benutzer eventuelle Übereinstimmungen präsentiert. In der kostenfreien Variante, wird maximal ein Treffer ausgegeben. Wer alle Treffer erhalten möchte, muss pro Suche 0.05 $ zahlen, was meiner Ansicht nach ein durchaus günstiger Preis ist – gemessen an dem Schaden, den Content Diebstahl anrichten kann.

Content Diebstahl erkennen
Mit Copyscape lässt sich leicht Content Diebstahl erkennen

Auf diese Weise lässt sich sehr leicht herausfinden, ob und wo der selbst geschriebene Inhalt an anderer Stelle im Internet nochmals auftaucht. Die Ergebnisse verlinken direkt auf die gefundenen Plagiate, was eine Begutachtung sowie eine Kontaktaufnahme ermöglicht.

Wer sich näher mit dem Thema Duplicate Content und Suchmaschinenoptimierung beschäftigen möchte, dem empfehle ich das Buch „Blog Boosting Marketing“ von Michael Firnkes.