• Auf SEOlicious.de wurden bereits 101 Beiträge geschrieben und dazu 991 Kommentare verfasst - Wenn dir mein SEO-Blog gefällt, abonniere bitte hier meinen Feed!

Duplicate Content mittels .htaccess-Datei vermeiden

Februar 23, 2008 von Seolicious |

Man kann es sich nur schwer vorstellen, aber sogar mir ist es passiert, dass eine meiner kleineren Seiten auf Grund von Duplicate Content in die sogenannte Sandbox gewandert ist. ;) Und nein, ich habe nicht den kompletten Inhalt aus wikipedia.org auf meine Seite kopiert. Der Fehler lag darin, dass meine Seiteninhalte über 2 Domains erreichbar waren.

Wie jetzt, zwei Domains?

Surfe doch einfach mal deine Homepage an. Einmal gibst du die Domain mit www. ein (also zum Beispiel http://www.ichwillnichtindiesandbox.de) und einmal ohne www. (also zum Beispiel http://ichwillnichtindiesandbox.de). Passiert jetzt irgendwas? Wirst du bei einer Variante jeweils auf die andere Variante weitergeleitet? Nein? – Dann solltest du diesen Beiträg weiter verfolgen.

Was denkt sich Google?

Für einen Besucher ergeben die unterschiedlichen Varianten keinen Unterschied, doch Google sieht das leider ein bisschen differenzierter. Für Google ist der Inhalt deiner Seite über 2 Domains erreichbar und somit liegt genauso Duplicate Content vor, als wenn du bspw. Inhalte von Wikipedia.org klaust. Im schlimmsten Fall wird deine Seite jetzt abgestraft und fliegt aus den Suchergebnissen.

Was kann ich dagegen machen? – Methode 1

Die beste Variante gegen diesen aufgeführten Fall ist eine Standarddomain festzulegen. Dies heißt, dass deine Domain jetzt bspw. nur noch über die Variante ohne www. anzusurfen ist. Gibt der User die Variante mit www. wird er über eine 301-Weiterleitung (Moved Permanently) auf die Variante ohne www. geleitet. Schon etwas kompliziert zu erklären, aber ich denke ihr habt mich verstanden. Die Frage ist jetzt nur noch, wie sowas zu realisieren ist.

Dazu erstellst du auf deinem Webspace eine Datei, die den Namen “.htaccess” trägt und fügst folgenden Code in diese:
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://www.%{HTTP_HOST}/$1 [R=301]

Wenn du nun deine Seite ansurfst, solltest du immer auf die Variante mit www. geleitet werden. Aus der Google Sandbox bist du damit noch lange nicht, aber dies werde ich an anderer Stelle thematisieren.

Zur Vollständigkeit noch der Code für eine Standarddomain ohne www.:
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://%{HTTP_HOST}/$1 [R=301]

Was kann ich dagegen machen? – Methode 2

Die zweite Methode kommt von Google selbst. Mit Hilfe der Webmaster Tools kannst du die bevorzugte Domain auswählen. Dazu loggst du dich einfach hier ein, wählst deine Domain aus, klickst auf Tools und unter dem Punkt “bevorzugte Domain festlegen” kannst du die nötigen Einstellung nun vornehmen.



Kommentare zum Beitrag (18)


  1. Christian sagt:

    Schöner Beitrag und verständlich geschrieben ;) Weiter so

  2. cilla sagt:

    ja, der Beitrag ist echt sinnvoll, ich habe auch lange gedacht, dass google keinen unterschied darin sieht wenn mit und ohne www. die selbe seite kommt..

  3. uhi sagt:

    Hallo,

    ich habe bei der Suche nach “.htaccess duplicate content” in Google deinen Beitrag gefunden und hoffe, du kannst mir weiter helfen.

    Folgendes Problem: ich habe (zu Testzwecken) eine Homepage als Subdomain unter http://ra-fussbroich.hiltmann.net angelegt. Leider hat Google diese Adresse schon indiziert. Jetzt sollen aber alle Aufrufe, die auf diese Domain gehen, auf die richtige Adresse http://www.ra-fussbroich.de umgeleitet werden.

    Ich will folgenden Eintrag in der .htaccess machen:
    Redirect permanent http://ra-fussbroich.hiltmann.net/(.*) http://www.ra-fussbroich.de/(.*)

    Ziel ist, dass Google alle Subdomain-Seiten in seinem Index durch die korrekten Seiten ersetzt.

    Wäre Klasse, wenn du mir hier weiter helfen könntest.

    Herzliche Grüße
    UHI

  4. admin sagt:

    Hallo,

    klappt doch wunderbar, was du gemacht hast :) Deine Testseite leitet auf die richtige Seite weiter – Das wird Google demnächst auch feststellen.

  5. uhi sagt:

    Hi ,

    hm, da habe ich scheinbar das richtige gemacht. ;-)
    War nur ein Versuch, aber hat wohl geklappt. Jetzt mal nur hoffen, dass Google die Subdomain-Seiten schnellstens aus dem Index haut, sonst gibts duplicate content.

    Erst mal danke für die Anleitung.

    Herzliche Grüße
    UHI

  6. silberstar sagt:

    Hi,

    wie sieht es folgendermaßen aus… URL meineseite.de und meineseite.de/index.html

    Das sind beides die gleichen Seiten.. wird das auch als doppelt angesehen oder wertet insbesondere Google diese Seiten als gleich ein… und somit kein Duplicate Content???

    Danke für Hinweise…

  7. admin sagt:

    Nein, das wird natürlich nicht als Duplicate Content angesehen. Sonst wären wahrscheinlich 90% aller Seiten Duplicate Content. ;)

    Gruß!

  8. James sagt:

    Danke für die Anleitung, habe es gerade eingebaut, funktioniert einwandfrei, großes Lob.

  9. Tools and More sagt:

    Bist du dir da sicher ? Dass es nicht immer als Doppelter Content gesehen wird .

    Also das mit dem Code funktioniert auf jeden Fall hab nen Strato Paket gibts da auch Unterschiede von Hoster zu Hoster?

    Vielen Dank

  10. Seolicious sagt:

    Was wird immer als Doppelter Content angesehen? So wie es dort steht, stimmt es schon – Das kannst du auch in diversen anderen Blogs durchlesen.

    Verstehe die Frage nicht so richtig, aber ich erwarte auch keine Antwort, da du sicherlich eh nur deinen Link, den ich mal eben editiert habe, ablegen wolltest. ;)

  11. unicl sagt:

    Hallo,

    guter Rat, danke! Ich habe aber noch eine Frage dazu ;-)

    Kann/darf ich beide Varianten verwenden (.htaccess + Webmastertools) oder kann es hier zu Problemen kommen. Außerdem gilt das bei den Webmastertools ja dann nur für Google?

    Noch eine Frage zum Thema DC: in meinem Navigationsmenü (textlinks) verweist der Link “Startseite” auf die index.html, angeblich soll das auch zu DC führen, stimmt das und wie löst man dieses Problem?

    Herzlichen Dank im Voraus.
    unicl

  12. Seolicious sagt:

    Die Methode mit .htaccess ist die elegantere, aber natürlich geht das bei Google auch mit den Webmaster Tools – Beides schadet natürlich nicht.

    Ja, das kann auch zu internem DC führen – So ist mir bspw. schonmal ein neues Projekt abgerutscht. Das Problem löst man mit:
    RewriteRule ^index\.(php|html)$ http://www.deine-domain.de/ [R=301,L]

  13. Kosmo sagt:

    Genau so habe ich es auch umgesetzt. Funzt echt gut.

  14. Henry sagt:

    Hey,

    leider hat der Code von oben nit mit meinem All-Inkl Webspace Paket geklappt, hab ein bisschen rumgesucht und “voíla”, hier ist der funktionierende Code:

    RewriteEngine On
    RewriteCond %{HTTP_HOST} ^www.deinedomain.de$ [NC]
    RewriteRule ^(.*)$ http://deinedomain.de/$1 [R=301,L]

    Also, falls der Code oben bei jemandem nicht funktionieren sollte, einfach mal den hier probieren ;)

  15. dadda sagt:

    Hallo Leute,

    leider klappt das bei mir nicht.
    Braucht man einen bestimmten Webspce dazu?
    Ich habe beide hier beschriebenen Varianten ausprobiert.

  16. Matthias sagt:

    leider funktioniert die version ohne www. nicht die wo auf www. umleitet funktioniert 1a wäre nett wenn da nochmal jemand drüberschauen könnte danke im vorraus

  17. Hallo!

    Ich bevorzuge es genau umgekehrt: Bei mir sollen alle Besucher von http://www.domain.de auf domain.de permanent umgeleitet werden – einschließlich Unterseiten!

    Leider bin ich erst noch dabei, den Syntax von Regex und die Eigenheiten des Apache kennenzulernen, deshalb hab ich mir folgenden Code ergoogelt:

    RewriteEngine On
    RewriteRule ^([^.?]+[^.?/])$ $1/ [R,L]
    RewriteCond %{HTTP_HOST} !^domain.de$
    RewriteRule ^(.*)$ http://domain.de/$1 [L,R=301]

    Die 2. Zeile wird scheinbar bei der Apache-Konfiguration meines Hosters benötigt, weil sonst das Slash am Ende der Domain fehlt.

    Vielleicht hilft es ja jemandem weiter.

  18. [...] Eine genaue Anleitung, sowie eine Weiterleitungsdatei finden Sie übrigens bei uns im Hosting Support unter der folgenden Adresse. Eine weitere, sehr ausführliche Anleitung ist unter dieser Adresse zu finden. [...]

Schreibe einen Kommentar zu "Duplicate Content mittels .htaccess-Datei vermeiden"