Duplicate Content mittels .htaccess-Datei vermeiden
Februar 23, 2008 von Seolicious
Man kann es sich nur schwer vorstellen, aber sogar mir ist es passiert, dass eine meiner kleineren Seiten auf Grund von Duplicate Content in die sogenannte Sandbox gewandert ist.
Und nein, ich habe nicht den kompletten Inhalt aus wikipedia.org auf meine Seite kopiert. Der Fehler lag darin, dass meine Seiteninhalte über 2 Domains erreichbar waren.
Wie jetzt, zwei Domains?
Surfe doch einfach mal deine Homepage an. Einmal gibst du die Domain mit www. ein (also zum Beispiel http://www.ichwillnichtindiesandbox.de) und einmal ohne www. (also zum Beispiel http://ichwillnichtindiesandbox.de). Passiert jetzt irgendwas? Wirst du bei einer Variante jeweils auf die andere Variante weitergeleitet? Nein? – Dann solltest du diesen Beiträg weiter verfolgen.
Was denkt sich Google?
Für einen Besucher ergeben die unterschiedlichen Varianten keinen Unterschied, doch Google sieht das leider ein bisschen differenzierter. Für Google ist der Inhalt deiner Seite über 2 Domains erreichbar und somit liegt genauso Duplicate Content vor, als wenn du bspw. Inhalte von Wikipedia.org klaust. Im schlimmsten Fall wird deine Seite jetzt abgestraft und fliegt aus den Suchergebnissen.
Was kann ich dagegen machen? – Methode 1
Die beste Variante gegen diesen aufgeführten Fall ist eine Standarddomain festzulegen. Dies heißt, dass deine Domain jetzt bspw. nur noch über die Variante ohne www. anzusurfen ist. Gibt der User die Variante mit www. wird er über eine 301-Weiterleitung (Moved Permanently) auf die Variante ohne www. geleitet. Schon etwas kompliziert zu erklären, aber ich denke ihr habt mich verstanden. Die Frage ist jetzt nur noch, wie sowas zu realisieren ist.
Dazu erstellst du auf deinem Webspace eine Datei, die den Namen “.htaccess” trägt und fügst folgenden Code in diese:
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://www.%{HTTP_HOST}/$1 [R=301]
Wenn du nun deine Seite ansurfst, solltest du immer auf die Variante mit www. geleitet werden. Aus der Google Sandbox bist du damit noch lange nicht, aber dies werde ich an anderer Stelle thematisieren.
Zur Vollständigkeit noch der Code für eine Standarddomain ohne www.:
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://%{HTTP_HOST}/$1 [R=301]
Was kann ich dagegen machen? – Methode 2
Die zweite Methode kommt von Google selbst. Mit Hilfe der Webmaster Tools kannst du die bevorzugte Domain auswählen. Dazu loggst du dich einfach hier ein, wählst deine Domain aus, klickst auf Tools und unter dem Punkt “bevorzugte Domain festlegen” kannst du die nötigen Einstellung nun vornehmen.
Abonniere meinen RSS-Feed
Dir hat der Beitrag "Duplicate Content mittels .htaccess-Datei vermeiden" gefallen? Um auch demnächst über neue Artikel auf SEOlicious.de benachrichtigt zu werden, abonniere doch bitte meinen RSS-Feed. Ich freue mich über jeden Leser - Dankeschön!





Schöner Beitrag und verständlich geschrieben
Weiter so
ja, der Beitrag ist echt sinnvoll, ich habe auch lange gedacht, dass google keinen unterschied darin sieht wenn mit und ohne www. die selbe seite kommt..
Hallo,
ich habe bei der Suche nach “.htaccess duplicate content” in Google deinen Beitrag gefunden und hoffe, du kannst mir weiter helfen.
Folgendes Problem: ich habe (zu Testzwecken) eine Homepage als Subdomain unter http://ra-fussbroich.hiltmann.net angelegt. Leider hat Google diese Adresse schon indiziert. Jetzt sollen aber alle Aufrufe, die auf diese Domain gehen, auf die richtige Adresse http://www.ra-fussbroich.de umgeleitet werden.
Ich will folgenden Eintrag in der .htaccess machen:
Redirect permanent http://ra-fussbroich.hiltmann.net/(.*) http://www.ra-fussbroich.de/(.*)
Ziel ist, dass Google alle Subdomain-Seiten in seinem Index durch die korrekten Seiten ersetzt.
Wäre Klasse, wenn du mir hier weiter helfen könntest.
Herzliche Grüße
UHI
Hallo,
klappt doch wunderbar, was du gemacht hast
Deine Testseite leitet auf die richtige Seite weiter – Das wird Google demnächst auch feststellen.
Hi ,
hm, da habe ich scheinbar das richtige gemacht.
War nur ein Versuch, aber hat wohl geklappt. Jetzt mal nur hoffen, dass Google die Subdomain-Seiten schnellstens aus dem Index haut, sonst gibts duplicate content.
Erst mal danke für die Anleitung.
Herzliche Grüße
UHI
Hi,
wie sieht es folgendermaßen aus… URL meineseite.de und meineseite.de/index.html
Das sind beides die gleichen Seiten.. wird das auch als doppelt angesehen oder wertet insbesondere Google diese Seiten als gleich ein… und somit kein Duplicate Content???
Danke für Hinweise…
Nein, das wird natürlich nicht als Duplicate Content angesehen. Sonst wären wahrscheinlich 90% aller Seiten Duplicate Content.
Gruß!
Danke für die Anleitung, habe es gerade eingebaut, funktioniert einwandfrei, großes Lob.
Bist du dir da sicher ? Dass es nicht immer als Doppelter Content gesehen wird .
Also das mit dem Code funktioniert auf jeden Fall hab nen Strato Paket gibts da auch Unterschiede von Hoster zu Hoster?
Vielen Dank
Was wird immer als Doppelter Content angesehen? So wie es dort steht, stimmt es schon – Das kannst du auch in diversen anderen Blogs durchlesen.
Verstehe die Frage nicht so richtig, aber ich erwarte auch keine Antwort, da du sicherlich eh nur deinen Link, den ich mal eben editiert habe, ablegen wolltest.
Hallo,
guter Rat, danke! Ich habe aber noch eine Frage dazu
Kann/darf ich beide Varianten verwenden (.htaccess + Webmastertools) oder kann es hier zu Problemen kommen. Außerdem gilt das bei den Webmastertools ja dann nur für Google?
Noch eine Frage zum Thema DC: in meinem Navigationsmenü (textlinks) verweist der Link “Startseite” auf die index.html, angeblich soll das auch zu DC führen, stimmt das und wie löst man dieses Problem?
Herzlichen Dank im Voraus.
unicl
Die Methode mit .htaccess ist die elegantere, aber natürlich geht das bei Google auch mit den Webmaster Tools – Beides schadet natürlich nicht.
Ja, das kann auch zu internem DC führen – So ist mir bspw. schonmal ein neues Projekt abgerutscht. Das Problem löst man mit:
RewriteRule ^index\.(php|html)$ http://www.deine-domain.de/ [R=301,L]
Genau so habe ich es auch umgesetzt. Funzt echt gut.
Hey,
leider hat der Code von oben nit mit meinem All-Inkl Webspace Paket geklappt, hab ein bisschen rumgesucht und “voíla”, hier ist der funktionierende Code:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.deinedomain.de$ [NC]
RewriteRule ^(.*)$ http://deinedomain.de/$1 [R=301,L]
Also, falls der Code oben bei jemandem nicht funktionieren sollte, einfach mal den hier probieren
Hallo Leute,
leider klappt das bei mir nicht.
Braucht man einen bestimmten Webspce dazu?
Ich habe beide hier beschriebenen Varianten ausprobiert.