Gegenstand dieser Seite sind Umleitungen mittels .htaccess
- für nicht mehr existierende oder dauerhaft gelöschte Web-Seiten oder Dokumente
- auf Fehlerseiten für die HTTP-Statuscodes 404 und 410
- für das Vermeiden "doppelten Inhalts" (duplicate content).
Übersicht:
Wird eine Webseite (eine Rubrik, d. h. ein Verzeichnis bzw. ein Pfad auf dem Server)
nachträglich umbenannt, so kann der alte Verzeichnis- bzw. Pfadname in der .htaccess auf den
neuen Namen umgeleitet werden.
In der BaBox wird die nicht mehr existierende Rubrik
www.babox.ch/intern mit dem folgenden Eintrag in der .htaccess auf die Rubrik www.babox.ch/box umgeleitet:
zurück | nach oben
Wird eine
Verzeichnis-Struktur umbenannt, so kann die alte Verzeichnisstruktur (mit allem was darinnen ist) in der .htaccess auf die neue Verzeichnisstruktur umgeleitet werden.
In der BaBox war die Präsentation der Weblica-Designs zuerst unter der Rubrik "tests" in der Verzeichnisstruktur "/tests/designs/" angesiedelt. Später wurde eine eigene Rubrik "weblica" eingerichtet, und die Designpräsentationen wurden in die Verzeichnisstruktur "/weblica/wdesigns/" verschoben.
Die Umleitung der alten auf die neue Verzeichnisstruktur erfolgt in der .htaccess mit folgendem Eintrag:
Alternative:
RewriteEngine on
RewriteRule ^(.*)tests/designs([^0-9]*)$ /$1weblica/wdesigns$2 [R=301,L]
Beispiellinks:
http://www.babox.ch/tests/designs/index.html
http://www.babox.ch/tests/designs/wdsiliconb/silicon_blue_3/index.html
zurück | nach oben
Dauerhaft gelöschte Webseiten - z. B. Testseiten, die nicht durch andere Seiten ersetzt wurden, möchte man gerne auch aus den Suchmaschinen entfernt sehen.
Dazu erzwingt man mit der "
Redirect Gone"-Direktive in der .htaccess den
HTTP-Statuscode 410, der dem Besucher - also auch den Suchmaschinen - mitteilt, dass eine Seite nicht mehr existiert (und auch nicht durch eine andere Seite ersetzt wurde).
Für die menschlichen Besucher erstellt man eine eigene Fehlerseite für den HTTP-Statuscode 410. Die Einträge in der .htaccess lauten:
Beispiel:
http://www.babox.ch/tests/link_mit_404/index.html
Die Hinweise oben zur Pfadangabe gelten auch hier.
Das Entfernen aus den Suchmaschinen geht erfahrungsgemäss erstaunlich schnell.
Dachten wir.

Monate später greift Google dann wieder auf die gelöschten Seiten zu; offenbar werden die Links bei Google archiviert und irgendwann reaktiviert. Deshalb empfehlen wir, die Redirect Gone-Direktiven in der .htaccess beizubehalten.
zurück | nach oben
Das Entfernen dauerhaft gelöschter Dokumente aus den Suchmaschinen funktioniert in genau gleicher Art und Weise wie oben für Webseiten beschreiben.
Dazu wird in der "Redirect"-Direktive statt der (relativen) Webseitenadresse die Adresse des Dokuments angegeben, z. B.
zurück | nach oben
Tote Links (in Webseiten, Bookmarks, oder Suchmaschinenergebnissen) verweisen auf nicht (mehr) vorhandene Webseiten oder Dateien und werden mit dem
HTTP-Statuscode 404 quittiert. Der Benutzer sieht eine Fehlermeldung des Inhalts "nicht gefunden" oder "not found". Beispiel-Link (öffnet in neuem Fenster):
http://www.babox.ch/ichbinnichtda/index.html
Der Beispiel-Link demonstriert, dass es wesentlich eleganter und benutzerfreundlicher ist, HTTP-Statuscode 404 abzufangen. Dazu wird erstens eine
Fehlerseite erstellt und zweitens in der .htaccess (Apache-Konfigurationsdatei) eine Umleitung für den 404-Fehler auf die Fehlerseite eingetragen. Der Umleitungseintrag in der .htaccess lautet:
Hinweis: unbedingt den relativen Pfad zur Fehlerseite angeben - sonst wird bei der Anzeige der Fehlerseite der HTTP-Statuscode 200 zurückgegeben, der Besucher und vor allem Suchmaschinen verwirrt.
Mehr dazu in Googles Webmaster Tools: falsche 404-Fehler.
Eine elegante und benutzerfreundliche Lösung ist in den Codeschnipseln in der Rubrik
HTML-Code für Fehlerseite dokumentiert.
zurück | nach oben
Eine dritte wichtige Anwendung der Umleitung mittels .htaccess ist das Festlegen der sogenannten "
kanonischen URL", das ist die Standardadresse, unter der die Website
verfügbar sein soll. Beispiel: babox.ch ohne und mit "www."-Präfix. Die Variante ohne "www." wird mittels .htaccess auf die Variante mit "www." umgeleitet:
Mit dieser Umleitung wird auch das Problem des "doppelten Inhalts" ("duplicate content", vgl. dazu auch Googles Richtlinien) gelöst.
Anwendung:
http://babox.ch (Variante mit "www." öffnet in neuem Fenster).
zurück | nach oben
Auch die Erreichbarkeit einer Website mit und ohne index.html (also sowohl unter www.babox.ch/index.html als auch unter www.babox.ch) wird von Suchmaschinen als "duplicate content" gewertet.
Lösung: Umleitung mittels .htaccess:
Anwendung:
http://www.babox.ch/index.html (Variante ohne index.html öffnet in neuem Fenster).
Mehr zum Problem "duplicate content" im Abschnitt Richtlinien und Empfehlungen zu Einzelthemen des Webdesigns, mit einem Link auf einen nützlichen Artikel in Googles Webmaster Tools.
zurück | nach oben