Beat: Seite nicht auffindbar - Was tun?

Beitrag lesen

Hallo Sven

Ich bedanke mich mal für deinen ausführlichen Test.
Da habe ich mich also schadlos als "Client" aus dem Fenster gelehnt.

Meine Einschätzung der HTTP RFCs ist, dass sie keineswegs lückenlos sind. Sie geben zwar gut den generellen Ablauf wieder sowie die allgemeiner Syntax. Aber ein exaktes Ablaufschema für jeden Fall fehlt dort (wäre wohl auch nicht machbar).

Meine Auffassung ist (und hoffentlich bleibe ich hierbei nicht allein), dass der Statuscode wirklich viel darüber aussagt, wie mit weiteren header und content verfahren werden soll.
Dass bei einem 404 zum Beispiel der content an den User weitergegeben wird, ist für einen Browser sinnvoll, würde aber für einen Serverbasierten HTTP Request keinen Sinn machen. Dieser soll sich wirklich nur auf 404 verlassen.

Des weiteren wäre interessant: PHP gibts ja als Modul und als CGI. Perl wird praktisch nur als CGI betrieben. Hier gibt es meiner Ahnung nach verschiedene Interdependenzen zwischen dem Server und dem Prozess.

Wenn du ein Perlprogramm via CGI aufrufst, so ist der Aufruf allein bereits ein 200 Status wert. Woher kommt das? Es wird ja nicht vom Script extra eine Statuszeile geschrieben. Es ist (so meine Vermutung) Der Server, welcher den Response vorbelegt. Existiert das Script, und produziert es Output, dann ist das aus der Sicht des Servers ein 200er.

Ich habe schon versucht einen 404 Statuscode auszugeben, was aber fehl schlug (Fehler kann bei mir liegen). Es wurde brav 200 ausgegeben, wie das ja richtig ist. Solches Verhalten wäre mir auch erklärlich.

Suchmaschinen testen nämlich durchaus auch das Serververhalten bei Requests auf nicht existierende Ressourcen. Viele Server sind nämlich so programmiert, dass sie (dummerweise) gar keinen Status 404 rausrücken, sondern irgendwie immer mit einer Standardantwort ankommen. Durch den Test können die Spider dann unterscheiden, ob die Seite tatsächlich existiert, oder doch eher als 404 einzuschätzen ist.

Das ist genau das CGI Problem. Der Prozess kann nämlich ausgeführt werden, auch wenn ungültige Parameter Werte zur Ausgabe einer Standard-Seite führen.
Allerdings habe ich solche intelligente Test bei meinem Fall nicht feststellen können. MSN war hier am penetrantesten. bestimmte urls aus der Anfangszeit werden heute noch regelmässig angefordert.

mfg Beat

--
Woran ich arbeite:
X-Torah
><o(((°>      ><o(((°>
   <°)))o><                      ><o(((°>o