Gary: Google von Vorgestern?

Hi zusammen,

Wollte kurz überprüfen, ob Google schon meine alte URL mit neuem Inhalt findet, und habe ein Kuriosum entdeckt:

Wenn ich im Suchfeld von google "wc-report" eingebe, findet er zwar die URL www.wc-report.info, listet aber in der Beschreibung des Suchergebnisses den Inhalt vor Wochen! D. h. der Soll-Inhalt den Google bringt existiert bereits seit einer Woche nicht mehr.

Wie kommt das?
Kann man das ändern?

Grüße Gary

  1. Hallo,

    D. h. der Soll-Inhalt den Google bringt existiert bereits seit einer Woche nicht mehr.
    Wie kommt das?

    Google hält die Informationen, die die Suchmaschine für relevant hält, in einem Cache vor. Dazu gehören Seitentitel, vermutlich relevante Schlagworte und oft auch Ausschnitte aus dem Seiteninhalt, die dann mit dem Suchtreffer angezeigt werden.

    Kann man das ändern?

    Nicht direkt. Warte, bis der Googlebot mal wieder bei dir vorbeikommt und die dann gefundenen Informationen neu bewertet und indiziert. Das kann einige Tage bis wenige Wochen dauern.

    Ciao,
     Martin

    --
    Lieber eine Stumme im Bett, als eine Taube auf dem Dach.
    Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
    1. Hi Martin,

      Danke für deine Antwort - die im Gegensatz zu anderen Antworten -  klar und wertungsfrei erfolgte!

      Ich dachte immer das Google das Internet quasi "live" abfrägt und eben nicht cashed.

      Danke.

      Gruß Gary

      1. Ich dachte immer das Google das Internet quasi "live" abfrägt und eben nicht cashed.

        Wie soll das den möglich sein? (Davon was das für den Traffic für google und jeden webbmaster bedeuten würde mal abgesehen.) Außerdem steht an fast jedem Suchergebnis ein Link zum Cache dran. Das müßte einem doch irgendwann mal ins Auge fallen, hätte ich gedacht.

        google-Suchergebnis:
        WC-Report
        Steuerausgleich-a. Das alljährliche Ärgernis ist sicher jedem bekannt - die Steuererklärung! Sie ist eindeutig das Produkt von Bürokraten. ...
        www.wc-report.info/ - Im Cache - Ähnliche

        1. Hallo,

          [...] Außerdem steht an fast jedem Suchergebnis ein Link zum Cache dran.

          je nach verwendetem Browser!
          Alte IEs und alte Operas kriegen diesen Link nämlich gar nicht erst angeboten, neuere Operas und Firefoxe dagegen schon (bei identischer Suchanfrage). Neue IEs (>6) vermutlich auch, das kann ich aber im Moment mangels Delinquent nicht verifizieren.

          So long,
           Martin

          --
          "Life! Don't talk to me about life!"
            (Marvin, the paranoid android in Douglas Adams' "The Hitchhiker's Guide To The Galaxy")
          Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
          1. [...] Außerdem steht an fast jedem Suchergebnis ein Link zum Cache dran.

            je nach verwendetem Browser!
            Alte IEs und alte Operas kriegen diesen Link nämlich gar nicht erst angeboten

            Das habe ich nie erlebt.

            ... neuere Operas und Firefoxe dagegen schon (bei identischer Suchanfrage). Neue IEs (>6) vermutlich auch, ...

            IE 6 zeigt die Links.

              1. Abend zusammen,

                Und noch eine "nervende" Frage:

                Kann es sen, daß Google serverseitig generierten Content, über Perl mittels SSI in die Webseite eingebaut, nicht lesen kann?

                Habe für Testzwecke mal den Metacode von Selfhtml ausprobiert:

                <meta name="keywords" content="Elektron, Elektronen, Wissen, Magnet, Magnetismus, Gravitation, Gravitationskraft, Teilchen, Atom">

                Kann meine Seite aber mit google nicht finden.

                Grüße Gary

                1. Hi,

                  Abend zusammen,

                  Abend?? Es ist doch erst früher Nachmittag ...

                  Kann es sen, daß Google serverseitig generierten Content, über Perl mittels SSI in die Webseite eingebaut, nicht lesen kann?

                  Nein.
                  Der Googlebot ist ein HTTP-Client wie ein Browser. Er liest denselben per HTTP gelieferten Content. Es sei denn, dein Server gibt ihm absichtlich etwas anderes.

                  <meta name="keywords" content="Elektron, Elektronen, Wissen, Magnet, Magnetismus, Gravitation, Gravitationskraft, Teilchen, Atom">

                  Es wird behauptet, dass die keywords-Direktive als meta-Element schon lange nicht mehr beachtet wird.

                  Ciao,
                   Martin

                  --
                  Man sollte keinen Senf von sich geben, wenn man nicht auch das Würstchen dazu liefern kann.
                  Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
                  1. Hi Martin,

                    Abend zusammen,

                    Abend?? Es ist doch erst früher Nachmittag ...

                    Das liegt daran, daß ich Krankgeschrieben bin, da verliere ichimmer mein Zeitgefühl...

                    Nein.
                    Der Googlebot ist ein HTTP-Client wie ein Browser. Er liest denselben per HTTP gelieferten Content. Es sei denn, dein Server gibt ihm absichtlich etwas anderes.

                    Ok, ich hoffe mal, daß dies der gemietete Indianer vom Stamme der "Apatschen" nicht tut.

                    Es wird behauptet, dass die keywords-Direktive als meta-Element schon lange nicht mehr beachtet wird.

                    Cool! Das ist ja so als hätte man einen Lichtschalter Zuhause, der nicht funktioniert - quasi nur zur Zierde!

                    Und wenn die Linkvariante (je mehr Verlinkungen - desto besser die Googlebotabfrage) zutrifft, habe ich mit meinem "Einseitendesign" alles über "Anker" schlechte Karten überhaupt gefunden zu werden...

                    Naja

                    Grüße Gary

                    1. Hallo,

                      Abend?? Es ist doch erst früher Nachmittag ...
                      Das liegt daran, daß ich Krankgeschrieben bin, da verliere ichimmer mein Zeitgefühl...

                      oh, na dann wünsche ich gute Besserung. Auch gesundheitlich. *kopfeinzieh*

                      Der Googlebot ist ein HTTP-Client wie ein Browser. Er liest denselben per HTTP gelieferten Content. Es sei denn, dein Server gibt ihm absichtlich etwas anderes.
                      Ok, ich hoffe mal, daß dies der gemietete Indianer vom Stamme der "Apatschen" nicht tut.

                      Sicher nicht, wenn du ihn nicht ausdrücklich dazu anstiftest.

                      Es wird behauptet, dass die keywords-Direktive als meta-Element schon lange nicht mehr beachtet wird.
                      Cool! Das ist ja so als hätte man einen Lichtschalter Zuhause, der nicht funktioniert - quasi nur zur Zierde!

                      Ja, so ähnlich. Es ist eher so wie eine Türsprechanlage, die abgeklemmt wurde, weil die Kids die ganze Zeit dran rumgespielt haben. Im Ernst: Die "keywords" in HTML-Dokumenten waren ja durchaus eine vernünftige Idee. Leider gab es im Lauf der Zeit zu viele Hirnis, die allen möglichen Sch..dreck da reingeklatscht haben, um sich das Ranking in den Suchmaschinen zu verbessern, ohne dass ihre Dokumente aber wirklich den versprochenen Inhalt hatten.
                      Deswegen -so wird behauptet- beachtet Google diese Keywords gar nicht mehr, ein paar andere Suchmaschinen nur noch am Rande.

                      Und wenn die Linkvariante (je mehr Verlinkungen - desto besser die Googlebotabfrage) zutrifft, habe ich mit meinem "Einseitendesign" alles über "Anker" schlechte Karten überhaupt gefunden zu werden...

                      Ähm, nein. Du brauchst Verlinkungen von *anderen* Webangeboten zu dir. Die Anzahl der Seiten deiner eigenen Webpräsenz ist dabei unerheblich - auch größere Sites profitieren ja nicht von ihren internen Links. Das wäre ja noch schöner! :-)

                      So long,
                       Martin

                      --
                      Die Zeit, die man zur Fertigstellung eines Projekts wirklich braucht, ist immer mindestens doppelt so lang wie geplant.
                      Wurde dieser Umstand bei der Planung bereits berücksichtigt, gilt das Prinzip der Rekursion.
                      Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
            1. Hallo,

              [...] Außerdem steht an fast jedem Suchergebnis ein Link zum Cache dran.
              Alte IEs und alte Operas kriegen diesen Link nämlich gar nicht erst angeboten
              Das habe ich nie erlebt.

              vielleicht hast du nicht darauf geachtet.

              ... neuere Operas und Firefoxe dagegen schon (bei identischer Suchanfrage). Neue IEs (>6) vermutlich auch, ...
              IE 6 zeigt die Links.

              Ja. IE5.5 und Opera 8.54 auch (wieder). Das war aber mal eine Zeitlang nicht so.
              Vermutlich wurde das korrigiert, als man sich entschlossen hat, auch die Verlinkung in den Suchergebnislisten browserabhängig zu gestalten. Ich suche beispielsweise nach der berühmten Hommingberger Gepardenforelle. Im IE5.5 und Opera 8.54 bekomme ich als ersten Treffer:

              Hommingberger Gepardenforelle – Wikipedia
              Hommingberger Gepardenforelle ist ein Suchbegriff, mit dem das Computermagazin c't im April 2005 einen Suchmaschinenoptimierungs-Wettstreit ausrief. ...
              http://de.wikipedia.org/wiki/Hommingberger_Gepardenforelle - 41k - [Cached] - [Similar pages]

              Man beachte, dass die Verlinkung des Titels auf http://www.google.de/url?q=http://de.wikipedia.org/... verweist, nicht direkt auf die gefundene Seite, und dass in der unteren Zeile die URL vollständig (mit http-Präfix) angezeigt wird.

              Im Firefox 3 sieht das geringfügig anders aus:

              Hommingberger Gepardenforelle – Wikipedia - [Translate this page]
              Hommingberger Gepardenforelle ist ein Suchbegriff, mit dem das Computermagazin c't im April 2005 einen Suchmaschinenoptimierungs-Wettstreit ausrief. ...
              Der Wettbewerb - Strategien - Entwicklung
              de.wikipedia.org/wiki/Hommingberger_Gepardenforelle - [Cached] - [Similar]

              Man beachte, dass der Link "Translate this page" den älteren Browsern nicht angeboten wurde, ebensowenig die Site-internen Links. Merkwürdig finde ich ebenfalls, dass die Verlinkung hier *direkt* auf die gewünschte Seite verweist, und nicht erst auf Google; und dass in der URL in der letzten Zeile das Präfix "http://" fehlt. Und statt "Similar pages" steht hier nur noch "Similar", und die Größe der Ressource (41k) wird auch unterschlagen.

              Definitiv liefert Google also je nach UA geringfügig unterschiedlich aufbereitete Listen aus (die Unterschiede sind tatsächlich im HTML-Quellcode), und einige Monate fehlte auch der "Cached"-Link in älteren Browsern. Ich habe ihn ein paarmal echt vermisst.

              So long,
               Martin

              --
              Lieber blau machen, als sich schwarz ärgern.
              Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
  2. Wollte kurz überprüfen, ob Google schon meine alte URL mit neuem Inhalt findet, und habe ein Kuriosum entdeckt:

    Kuriosum? Kurios ist nicht mal wie oft Du hier mit deiner Seite aufschlägst.

    ... google ... listet aber in der Beschreibung des Suchergebnisses den Inhalt vor Wochen! D. h. der Soll-Inhalt den Google bringt existiert bereits seit einer Woche nicht mehr.

    Wie kommt das?

    Was ist an dem Begriff Cache unklar? Google hat für jede website einen mutmaßlich angemessenen Aktualisierungsturnus.

    Kann man das ändern?

    Wenn sich deine Inhalte in höherer Frequenz ändern, dann wird google eventuell den Turnus verkürzen.