hotti: mode rewrite und Not Found

hi,

mein rewrite schießt alle *.html auf ein Script um, was die Datei aus einer DB fischt. Falls das Script dort nicht fündig wird, erfolgt eine Umleitung auf 404.cgi, diese Umleitung gibt erstmal den Status 302 aus.

Das Script 404.cgi schließlich gibt einen Status 404 aus, danach den Content-type: text/html und dann eine Seite, die dem Besucher weiterhilft.

Insgesamt wird also erst der Status 302 und dann der Status 404 ausgegeben, ist das für einen Bot (der evntl. tote Seiten im Index hat) ok?

Viele Grüße,
Horst Haselhuhn

--
An dieser Stelle komme ich nicht weiter.
  1. Hi,

    mein rewrite schießt alle *.html auf ein Script um, was die Datei aus einer DB fischt. Falls das Script dort nicht fündig wird, erfolgt eine Umleitung auf 404.cgi, diese Umleitung gibt erstmal den Status 302 aus.

    Warum Umleitung?

    Verzichte darauf, und behandle den "Fehler" an Ort und Stelle.

    Insgesamt wird also erst der Status 302 und dann der Status 404 ausgegeben, ist das für einen Bot (der evntl. tote Seiten im Index hat) ok?

    Bei "toten" Seiten mögen Bots einen 410 Gone lieber als 404.

    MfG ChrisB

    --
    Light travels faster than sound - that's why most people appear bright until you hear them speak.
  2. Lieber hotti,

    ich würde die 404er Seite nicht durch eine header-Weiterleitung, sondern durch das Ausliefern eines Fehlerdokuments (mit dem HTTP-Statuscode 404) unter der aktuellen URL erledigen. Das bedeutet für den Bot, dass er keinen 302er "unterwegs" erhält, bevor Dein Script "merkt", dass es in der DB nix passendes finden kann.

    Liebe Grüße,

    Felix Riesterer.

    --
    ie:% br:> fl:| va:) ls:[ fo:) rl:° n4:? de:> ss:| ch:? js:) mo:} zu:)
  3. Hallo,

    mein rewrite schießt alle *.html auf ein Script um, was die Datei aus einer DB fischt. Falls das Script dort nicht fündig wird, erfolgt eine Umleitung auf 404.cgi, diese Umleitung gibt erstmal den Status 302 aus.
    Das Script 404.cgi schließlich gibt einen Status 404 aus, danach den Content-type: text/html und dann eine Seite, die dem Besucher weiterhilft.

    das mag für menschliche Besucher okay sein; für Clients, die wirklich den HTTP-Status auswerten, ist es gemein.

    Insgesamt wird also erst der Status 302 und dann der Status 404 ausgegeben, ist das für einen Bot (der evntl. tote Seiten im Index hat) ok?

    Hmm ...
    Erster Request:
     302 - "Was du willst, gibt's hier nicht, aber gleich um die Ecke."
    Zweiter Request, um die Ecke:
     404 - "Ätsch, gibt's nicht."

    Ich käme mir da irgendwie veräppelt vor. Anstatt auf eine 404-Fehlerseite *weiterzuleiten*, wäre es sinnvoller, den Status 404 direkt auszugeben, und keinen Redirect.

    Ciao,
     Martin

    --
    Computer lösen für uns Probleme, die wir ohne sie gar nicht hätten.
    1. moin,

      Ich käme mir da irgendwie veräppelt vor. Anstatt auf eine 404-Fehlerseite *weiterzuleiten*, wäre es sinnvoller, den Status 404 direkt auszugeben, und keinen Redirect.

      Stimmt, so beguckt ist das wirklich doof. Klare Verhältnisse hab ich jetzt, vielen Dank für Eure Hinweise,

      viele Grüße an alle,
      Horst

      --
      Status: 999 gomm gleisch wida