Sanny: google soll datei möglichst schnell aus dem Index nehmen

Hallo,

wir verwalten die Webseite eines unserer Kunden.
Dieser hat nun einen Mitarbeiter entlassen, und wir haben die Seiten, die den Mitarbeiter betreffen, vom Server gelöscht.

Leider ist es nun so, dass google nach wie vor, wenn nach dieser Person gesucht wird, die Seite im Index hat, trotz 404-Error.

Unserem Kunden ist es allerdings wichtig, dass man so schnell wie möglich diesen Namen nicht mehr in Verbindung mit ihrer Firma bringt (ist eine offensichtlich seriöse Kanzlei- keine Ahnung, die werden schon wissen, warum das so wichtig ist).

Natürlich wird Google irgendwann, wenn immer nur 404 ausgespuckt wird, den pagerank der Seite runternehmen und die Seite irgendwann ganz rausschmeissen. Aber gibt es einen Weg -z.B. über die .htaccess-, diesen Prozess zu beschleunigen? Wenn ja, welche Fehlermeldung soll rein? Die 410 (Gone)?

Danke!
LG, Sanny

  1. Hi,

    Unserem Kunden ist es allerdings wichtig, dass man so schnell wie möglich diesen Namen nicht mehr in Verbindung mit ihrer Firma bringt

    Tja Keywords zu löschen dauert leider ewig. Google bringt meine Seite immernoch mit Worten in Verbindung, die seit knapp einem Jahr nicht mehr in meiner Seite vorkommen. Möglicherweise da andere Seiten immernoch mit diesen Worten auf mich verlinken...

    Wenn du jedoch eine bestimmte Seite aus dem Google Cache etc entfernen möchtest kannst du das hiertun.

    Vergiss ausserdem nicht die Seite ebenfalls aus der Way back machine zu entfernen.

    LG

    1. 'ǝɯɐu$ ıɥ

      wenn du sagen wolltest, das das internet nie vergisst, warum sagtst du es nicht? anon??????????????

      ssnɹƃ
      ʍopɐɥs

      --
      Luftpiraten sind Passagiere, die Flugzeuge erst unterwegs chartern.
      Danny Kaye
  2. 'ǝɯɐu$ ıɥ

    man kan google bitten (webmaster tools) etwas zu tun, der rest ist schweigen....

    ʍopɐɥs

    --
    Answers: $1, Short: $5, Correct: $25, dumb looks are still free ...
  3. Hi,

    Leider ist es nun so, dass google nach wie vor, wenn nach dieser Person gesucht wird, die Seite im Index hat, trotz 404-Error.

    ihr solltet zunächst sicherstellen, ob die Fehlerseite *wirklich* mit 404-Status ausgeliefert wird.
    Denn oft wird das ErrorDocument falsch konfiguriert, so dass in Wirklichkeit ein Redirect auf die URL des Error-Dokuments gesendet wird und der Client eben dieses Error-Dokument in einem zweiten Request selbst abholt. Selbst manche Branchenriesen wie etwa ebay machen das falsch. In diesem Fall sieht Google keine Veranlassung, die Seite aus dem Index zu nehmen, aus technischer Sicht ist ja schließlich alles perfekt.

    Wenn eure 404-Fehlerseite angezeigt wird - steht dann noch die ursprünglich angefragte URL in der Browser-Adresszeile (dann wär's wahrscheinlich korrekt), oder steht dort die Adresse der 404-Fehlerseite (dann wär's auf jeden Fall falsch)?

    Aber gibt es einen Weg -z.B. über die .htaccess-, diesen Prozess zu beschleunigen? Wenn ja, welche Fehlermeldung soll rein? Die 410 (Gone)?

    Ob's damit schneller geht, weiß ich nicht. Aber 410 wird gerade für diesen Fall oft empfohlen, weil es eine etwas andere Aussage transportiert. Status 404 heißt: Die gewünschte Ressource ist nicht verfügbar. Das kann ein vorübergehender Zustand sein. Status 410 besagt dagegen, sie ist endgültig weg.

    Ciao,
     Martin

    --
    Der Gast geht solange zum Tresen, bis er bricht.
    1. Status 410 besagt dagegen, sie ist endgültig weg.

      Ja, aber 410 heisst "hat mal existiert, jetzt nicht mehr"

      Aus dieser Information lassen sich Rückschlüsse ziehen.

      404 heisst "gibts nicht" ob die Seite existiert hat oder nicht, ist offen.

      1. Hi,

        Status 410 besagt dagegen, sie ist endgültig weg.

        Ja, aber 410 heisst "hat mal existiert, jetzt nicht mehr"

        Aus dieser Information lassen sich Rückschlüsse ziehen.

        Die braucht Google nicht zu ziehen, denn dass die Ressource mal existiert hat, weiss es bereits.

        MfG ChrisB

        --
        “Whoever best describes the problem is the person most likely to solve the problem.” [Dan Roam]
        1. Die braucht Google nicht zu ziehen, denn dass die Ressource mal existiert hat, weiss es bereits.

          Ich meinte nicht, dass Google Rückschlüsse daraus ziehen könnte sondern der Besucher, der nicht wissen soll, dass es den besagten Mitarbeiter mal gab.

          example.com/mitarbeiter/john_smith     -> 200
          example.com/mitarbeiter/max_mustermann -> 200
          example.com/mitarbeiter/john_doe       -> 404
          example.com/mitarbeiter/john_wayne     -> 410

          Wenn das Schema der URLs wie im Beispiel nachvollziehbar ist, lässt sich damit auf einfache Weise sagen, dass John Wayne mal als Seite existiert hat.

          1. [latex]Mae  govannen![/latex]

            example.com/mitarbeiter/john_smith     -> 200
            example.com/mitarbeiter/max_mustermann -> 200
            example.com/mitarbeiter/john_doe       -> 404
            example.com/mitarbeiter/john_wayne     -> 410

            Wenn das Schema der URLs wie im Beispiel nachvollziehbar ist, lässt sich damit auf einfache Weise sagen, dass John Wayne mal als Seite existiert hat.

            Wieso sollte jemand gezielt example.com/mitarbeiter/john_wayne aufrufen, wenn derjenige nicht ohnehin zumindest die Vermutung hat, daß diese Seite existier(t hab)en könnte?

            Cü,

            Kai

            --
            Resig is more like Javascript's Pee Wee Herman.  ;) (D.Mark in clj)
            Foren-Stylesheet Site Selfzeug JS-Lookup
            SelfCode: sh:( fo:| ch:? rl:( br:< n4:( ie:{ mo:| va:) js:| de:> zu:) fl:( ss:| ls:?
            1. Wieso sollte jemand gezielt example.com/mitarbeiter/john_wayne aufrufen, wenn derjenige nicht ohnehin zumindest die Vermutung hat, daß diese Seite existier(t hab)en könnte?

              Ggf. um weitere Indizien zu suchen um seine Vermutung zu untermauern?

          2. Hi,

            Ich meinte nicht, dass Google Rückschlüsse daraus ziehen könnte sondern der Besucher, der nicht wissen soll, dass es den besagten Mitarbeiter mal gab.

            Na ja, schon der Ansatz ist ja fragwürdig - unterschlagene Wahrheit ist auch gelogen.

            Aber hey, es war ja von einer „Kanzlei“ die Rede - wen wundert's also ...

            MfG ChrisB

            --
            “Whoever best describes the problem is the person most likely to solve the problem.” [Dan Roam]
    2. Halls,

      ja, in der Adresszeile steht nicht die URL der 404-Seite, somit sieht es dait schonmal gut aus. Danke!

      Wenn ich nun z.B. eine htaccess erstelle, die google sagt, dass es zwei pdfs definitiv nicht mehr gibt, erstelle ich einfach eine Datei namens .htaccess und schreibe rein:

      ErrorDocument 410 /english/meinpdf1.pdf
      ErrorDocument 410 /meinpdf2.pdf

      Oder? Bitte entschuldigt die dumme Frage, aber es ist recht dringend. Danach werde ich mehr darüber lernen, versprochen. :)

      Danke!
      LG, Sanny

      Hi,

      Leider ist es nun so, dass google nach wie vor, wenn nach dieser Person gesucht wird, die Seite im Index hat, trotz 404-Error.

      ihr solltet zunächst sicherstellen, ob die Fehlerseite *wirklich* mit 404-Status ausgeliefert wird.
      Denn oft wird das ErrorDocument falsch konfiguriert, so dass in Wirklichkeit ein Redirect auf die URL des Error-Dokuments gesendet wird und der Client eben dieses Error-Dokument in einem zweiten Request selbst abholt. Selbst manche Branchenriesen wie etwa ebay machen das falsch. In diesem Fall sieht Google keine Veranlassung, die Seite aus dem Index zu nehmen, aus technischer Sicht ist ja schließlich alles perfekt.

      Wenn eure 404-Fehlerseite angezeigt wird - steht dann noch die ursprünglich angefragte URL in der Browser-Adresszeile (dann wär's wahrscheinlich korrekt), oder steht dort die Adresse der 404-Fehlerseite (dann wär's auf jeden Fall falsch)?

      Aber gibt es einen Weg -z.B. über die .htaccess-, diesen Prozess zu beschleunigen? Wenn ja, welche Fehlermeldung soll rein? Die 410 (Gone)?

      Ob's damit schneller geht, weiß ich nicht. Aber 410 wird gerade für diesen Fall oft empfohlen, weil es eine etwas andere Aussage transportiert. Status 404 heißt: Die gewünschte Ressource ist nicht verfügbar. Das kann ein vorübergehender Zustand sein. Status 410 besagt dagegen, sie ist endgültig weg.

      Ciao,
      Martin

      1. Oder? Bitte entschuldigt die dumme Frage, aber es ist recht dringend. Danach werde ich mehr darüber lernen, versprochen. :)

        Den muss ich mir merken, danke!

        1. irgendjemand, der mir weiterhelfen kann?

          1. Hi,

            irgendjemand, der mir weiterhelfen kann?

            Du hast bereits zielführende Hinweise bekommen.

            MfG ChrisB

            --
            “Whoever best describes the problem is the person most likely to solve the problem.” [Dan Roam]
      2. Hi,

        Wenn ich nun z.B. eine htaccess erstelle, die google sagt, dass es zwei pdfs definitiv nicht mehr gibt, erstelle ich einfach eine Datei namens .htaccess und schreibe rein:

        ErrorDocument 410 /english/meinpdf1.pdf
        ErrorDocument 410 /meinpdf2.pdf

        nein, das ist Unfug. Das bedeutet: Falls ein Error 410 auftritt, soll dein Server die Datei /english/meinpdf1.pdf ausliefern. Oder /meinpdf2.pdf - hmm, welche nun eigentlich?

        Was du willst, ist:

        Redirect gone /english/meinpdf1.pdf
        Redirect gone /meinpdf2.pdf

        Mehr Info dazu in der Apache-Doku.

        Hi,

        Leider ist es nun so, ...
        [...]
        Ciao,
        Martin

        Und nächstes Mal bitte kein TOFU! Danke.

        So long,
         Martin

        --
        Wichtig ist, was hinten rauskommt.
          (Helmut Kohl, 16 Jahre deutsche Bundesbirne)
        1. Hallo Martin,

          vielen Dank!! Nachdem es ziemlich dringend war, habe ich hier tatsächlich keine "Hilfe zur Selbsthilfe" gesucht- zumindest erstmal nicht. Den Link, oder vielleicht auch mal nen Buch, werde ich mir auf jeden Fall demnächst mal gönnen.

          Liebe Grüße,
          Sanny

          Hi,

          Wenn ich nun z.B. eine htaccess erstelle, die google sagt, dass es zwei pdfs definitiv nicht mehr gibt, erstelle ich einfach eine Datei namens .htaccess und schreibe rein:

          ErrorDocument 410 /english/meinpdf1.pdf
          ErrorDocument 410 /meinpdf2.pdf

          nein, das ist Unfug. Das bedeutet: Falls ein Error 410 auftritt, soll dein Server die Datei /english/meinpdf1.pdf ausliefern. Oder /meinpdf2.pdf - hmm, welche nun eigentlich?

          Was du willst, ist:

          Redirect gone /english/meinpdf1.pdf
          Redirect gone /meinpdf2.pdf

          Mehr Info dazu in der Apache-Doku.

          Hi,

          Leider ist es nun so, ...
          [...]
          Ciao,
          Martin

          Und nächstes Mal bitte kein TOFU! Danke.

          So long,
          Martin

          1. vielen Dank!! Nachdem es ziemlich dringend war, habe ich hier tatsächlich keine "Hilfe zur Selbsthilfe" gesucht- zumindest erstmal nicht.

            Und wahrscheinlich wirst du das auch in Zukunft nicht tun, du liest ja nicht mal die Antworten der Teilnehmer und ignoriertst deren bitten:

            Und nächstes Mal bitte kein TOFU! Danke.

            Zudem zeigt das Archiv, dass du zumindest seit etwa sechs Monaten wenig initiative zeigst, selbst Lösungen zu finden.

            Den Link, oder vielleicht auch mal nen Buch, werde ich mir auf jeden Fall demnächst mal gönnen.

            Auch den muss ich mir merken.

            1. Hallo suit,

              Und nächstes Mal bitte kein TOFU! Danke.

              allerdings hat er die Bitte, auf TOFU zu verzichten, in sein FU aufgenommen.

              Gruß, Jürgen