ChrisB: trotz Eintrag in .htaccess mal 301 mal 404

Beitrag lesen

Hi,

Wenn ich die URL: http://www.kochstube-web.de/tag/vegetarisch/ im Browser eingebe, wird korrekt umgelenkt, d.h. die .htaccess "zieht".

Mit dem Web-Sniffer (web-sniffer.net) habe ich dann den Google-Bot simuliert und festgestellt, dass dieser eigentlich auch 301 generieren würden, wenn er mit "with host header" agieren würde. Mit der Einstellung "without host header" wird eine 404 erzeugt.
Kann mir das bitte jemand (laienhaft) erklären

Ein Domainname muss erst in eine IP-Adresse "übersetzt" werden, damit der Client eine Anfrage an den Server stellen kann; das macht das DNS, Domain Name System. Domainnamen sind nur etwas, was dem System übergestülpt wurde, weil sie für uns Menschen nun mal leichert zu merken sind und mehr aussagen, als blosse Ziffernfolgen.

Liegt auf einem Webserver jetzt nur eine Domain, dann braucht der Client nur eine Anfrage an die IP-Adresse zu stellen, und bekommt die Daten, die er haben wollte.
Bei "Shared Hosting" angeboten liegen nun aber viele verschiedene Websites (also verschiedene Domains) auf einem Server, und "teilen" sich eine IP.
Wenn der Client jetzt eine Anfrage an die IP stellt, dann weiss der Server zunächst mal nicht, welche der Domains der Client denn nun eigentlich meint.
Also gibt der Client im "Host Header" seiner Anfrage auch noch den Domainnamen mit - damit weiss der Server dann, an welchem der vielen Webangebote, die er über eine IP bereitstellt, der Client interessiert ist.

Das ist ähnlich, als wenn du telefonierst. Wenn deine Gesprächspartner alleine wohnt (oder ein Handy nutzt), dann bekommst du ihn "an die Strippe", wenn du die Telefonnummer anrufst.
Rufst du jedoch in der Zentrale einer grossen Firma an - dann musst du auch dazu sagen, dass du gerne Herrn Meier sprechen willst, um ihn an den Apparat zu bekommen.

und wie kann ich das auch für den google-bot "without host header" hinbekommen?

Der sollte eigentlich gar keine solchen Anfragen stellen. Google weiss um oben beschriebenes Szenario, und wird deshalb einen Host Header mitsenden, wenn es an Inhalten von einer bestimmten Domain interessiert ist.
Es ist aber denkbar, dass der auch mal zum Test solche Anfragen sendet, um zu schauen, wie der Server reagiert.

MfG ChrisB

--
Light travels faster than sound - that's why most people appear bright until you hear them speak.