Sanny: google soll datei möglichst schnell aus dem Index nehmen

Beitrag lesen

Halls,

ja, in der Adresszeile steht nicht die URL der 404-Seite, somit sieht es dait schonmal gut aus. Danke!

Wenn ich nun z.B. eine htaccess erstelle, die google sagt, dass es zwei pdfs definitiv nicht mehr gibt, erstelle ich einfach eine Datei namens .htaccess und schreibe rein:

ErrorDocument 410 /english/meinpdf1.pdf
ErrorDocument 410 /meinpdf2.pdf

Oder? Bitte entschuldigt die dumme Frage, aber es ist recht dringend. Danach werde ich mehr darüber lernen, versprochen. :)

Danke!
LG, Sanny

Hi,

Leider ist es nun so, dass google nach wie vor, wenn nach dieser Person gesucht wird, die Seite im Index hat, trotz 404-Error.

ihr solltet zunächst sicherstellen, ob die Fehlerseite *wirklich* mit 404-Status ausgeliefert wird.
Denn oft wird das ErrorDocument falsch konfiguriert, so dass in Wirklichkeit ein Redirect auf die URL des Error-Dokuments gesendet wird und der Client eben dieses Error-Dokument in einem zweiten Request selbst abholt. Selbst manche Branchenriesen wie etwa ebay machen das falsch. In diesem Fall sieht Google keine Veranlassung, die Seite aus dem Index zu nehmen, aus technischer Sicht ist ja schließlich alles perfekt.

Wenn eure 404-Fehlerseite angezeigt wird - steht dann noch die ursprünglich angefragte URL in der Browser-Adresszeile (dann wär's wahrscheinlich korrekt), oder steht dort die Adresse der 404-Fehlerseite (dann wär's auf jeden Fall falsch)?

Aber gibt es einen Weg -z.B. über die .htaccess-, diesen Prozess zu beschleunigen? Wenn ja, welche Fehlermeldung soll rein? Die 410 (Gone)?

Ob's damit schneller geht, weiß ich nicht. Aber 410 wird gerade für diesen Fall oft empfohlen, weil es eine etwas andere Aussage transportiert. Status 404 heißt: Die gewünschte Ressource ist nicht verfügbar. Das kann ein vorübergehender Zustand sein. Status 410 besagt dagegen, sie ist endgültig weg.

Ciao,
Martin