Tom: Wie oft kommt Google vorbei?

Hello,

nur mal so aus Interesse frage ich mal:

wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?

Harzliche Grüße aus http://www.annerschbarrich.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau
  1. Hi Tom,

    wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?

    Wie Du an dem fehlenden Pagerank der neuen URL sehen kannst, lassen die sich mit der Erfassung unserer neuen Seiten durchaus Zeit....

    Viele Grüße
    Mathias Bigge

  2. Hallo Tom,

    nur mal so aus Interesse frage ich mal:
    wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?

    Wie oft genau, kann ich dir nicht sagen. Aber immerhin belegte er im Juni 2004 Platz 13 der User-Agent-Hitliste mit 893 Hits. Siehe http://stats.selfhtml.org/webalizer/forum.de.selfhtml.org/usage_200406.html#TOPAGENTS

    viele Gruesse
      Stefan Muenz

    1. Hallo,

      nur mal so aus Interesse frage ich mal:
      wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?

      Wie oft genau, kann ich dir nicht sagen. Aber immerhin belegte er im Juni 2004 Platz 13 der User-Agent-Hitliste mit 893 Hits. Siehe http://stats.selfhtml.org/webalizer/forum.de.selfhtml.org/usage_200406.html#TOPAGENTS

      Wenn ich das richtig sehe, ist dort nur die Statistik eines Tages, nämlich des 30. Junis, verzeichnet. Zudem denke ich nicht, dass der User-Agent »Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.co...« tatsächlich der Googlebot ist. Meines Wissens nennt sich der Googlebot ausschließlich »Googlebot/2.1 (+http://www.googlebot.com/bot.html)«. Als solcher ist er dort auch mit 247 Hits verzeichnet. Die Logs bestätigen das, der Googlebot war z.B. heute morgen um halb vier mit dieser Kennung hier und hat sich die robots.txt geholt, /faq/ und /archiv/. Das ist wahrscheinlich der Freshbot, der nicht weiter ins Archiv absteigt.
      Vom Juli sind zumindest zwei Tage erfasst: http://stats.selfhtml.org/webalizer/forum.de.selfhtml.org/usage_200407.html#TOPAGENTS

      Mathias

      1. Hi Mathias,

        Zudem denke ich nicht, dass der User-Agent »Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.co...« tatsächlich der Googlebot ist. Meines Wissens nennt sich der Googlebot ausschließlich »Googlebot/2.1 (+http://www.googlebot.com/bot.html)«.

        er identifiziert sich tatsächlich meistens so. Allerdings verzeichne ich, wenn auch sehr selten, Besuche von Google über die erste UserAgent Kennung bei meinen Seiten. Dies sind definitiv Anfragen von Google, zu erkennen an der Google-IP, der Tatsache, daß er sich stets die robots.txt holt, stets nur ganz bestimmte Dateien aufruft, die absolut keine Einstiegsseiten sind und auch keinen Links direkt folgt.

        Interessant in diesem Zusammenhang: wie der ebenso echte Google-Spider "Googlebot/Test", der März/April sehr aktiv war, interessiert sich dieser Googlebot sehr für Javascript-Dateien. Ich vermute stark, daß Google dabei ist, Javascript zu lernen um entweder künftig auch Javascript-"Links" zu folgen oder/und um SEO-Tricks besser zu durchschauen.

        freundliche Grüße
        Ingo

  3. Hallo,

    wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?

    Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ. Und aufgrund der riesigen Datenmenge im Archiv nehme ich an, dass Google die Dokumente des Archivs größtenteils höchstens einmal im Monat neu indiziert. Es dauert auch einige Zeit, bis neu archivierte Threads in den Index kommen, siehe z.B. http://www.google.at/search?q=site:forum.de.selfhtml.org+2004+juni.

    Mathias

    1. Hallo molily,

      Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ.

      Doch, wird sie. Sie wird nur nicht gecached und die enthaltenen Links werden nicht weiterverfolgt.

      Beste Gruesse

      Jan

      1. Hallo,

        Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ.

        Doch, wird sie. Sie wird nur nicht gecached und die enthaltenen Links werden nicht weiterverfolgt.

        Ich meinte auch die Postings, dass / abgefragt wird, habe ich gesehen.
        Erstaunlich aber ist es schon, dass der Googlebot die Allow-Regeln wie Links wertet. Trotz nofollow wäre ich mir nicht sicher, ob das Verlinken von /faq/ und /archiv/ auf der Hauptseite nicht doch eine Rolle spielt. Wieso z.B. wird gerade /my/ vom Freshbot abgefragt?

        Mathias

        1. Hallo molily,

          Wieso z.B. wird gerade /my/ vom Freshbot abgefragt?

          Vermutlich, weil es auf http://aktuell.de.selfhtml.org/ verlinkt ist.

          Beste Gruesse

          Jan

    2. Hallo.

      Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ. Und aufgrund der riesigen Datenmenge im Archiv nehme ich an, dass Google die Dokumente des Archivs größtenteils höchstens einmal im Monat neu indiziert. Es dauert auch einige Zeit, bis neu archivierte Threads in den Index kommen, siehe z.B. http://www.google.at/search?q=site:forum.de.selfhtml.org+2004+juni.

      Momentan ist übrigens der 24.6 der letzte Tag zu dem man in Google noch Postings vom SELFForum lesen kann.

      Hier habe ich nach folgendem gesucht:
      site:forum.de.selfhtml.org SELFHTML "Forumsarchiv / 2004 / Juni" ", 24. 06. 2004,"
      http://www.google.at/search?hl=de&ie=UTF-8&q=site%3Aforum.de.selfhtml.org+SELFHTML+"Forumsarchiv+%2F+2004+%2F+Juni"+"%2C+24.+06.+2004%2C"&btnG=Suche&meta=

      Und hier habe ich nach folgendem gesucht:
      site:forum.de.selfhtml.org SELFHTML "Forumsarchiv / 2004 / Juni" ", 25. 06. 2004,"
      http://www.google.at/search?hl=de&ie=UTF-8&q=site%3Aforum.de.selfhtml.org+SELFHTML+"Forumsarchiv+%2F+2004+%2F+Juni"+"%2C+25.+06.+2004%2C"&btnG=Suche&meta=

      Und bei der zweiten Eingabe hat Google nichts mehr gefunden.

      Schönen Tag noch, H2O

      --
      Erst selber im </archiv/> suchen: http://suche.de.selfhtml.org/
      Dann gibt es noch http://www.google.de/ und erst dann das Forum fragen.
      ie:% fl:| br:^ va:| ls:# fo:) rl:? n4:| ss:{ de:] js:) ch:? sh:( mo:? zu:|
      Infos: http://emmanuel.dammerer.at/selfcode.html
  4. Hallo Tom,

    ich kann das natürlich nicht mit Bestimmtheit sagen, aber...

    wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?

    Ich vermute, doch sehr häufig. Denn ich habe von ein paar Tagen eine Frage hier im Forum gepostet und dabei die URL der Seite angegeben, um die es mir ging. Bis zu diesem Zeitpunkt war diese URL theoretisch nur mir bekannt - zumindest hatte ich sie noch nicht publik gemacht.
    Aber in den folgenden zwei Tagen hatte ich plötzlich über 30 (in Worten: über dreißig) Hits vom Googlebot mit dem UA "Googlebot/2.1 (+http://www.googlebot.com/bot.html)", und meine Seite ist jetzt bei Google bekannt. Ob ich das wirklich will, ist eine ganz andere Frage.

    Ich werte das jedenfalls als starkes Indiz dafür, dass der Googlebot auch die aktuellen Postings durchliest und von dort aus weitersucht. ;)

    Have a nice day,

    Martin

    --
    Wenn du beim Kochen etwas heißes Wasser übrig hast, friere es ein.
    Heißes Wasser kann man immer wieder gebrauchen.