Stephan Huber: googlebot

Beitrag lesen

Hallo Stefan,

anscheinend hast Du Deine Seite heute abend geändert, auf jeden Fall hatte ich mir das vor ein Paar Stunden angesehen, da sah' es auf den ersten Blick so aus, als hättest Du auf der Startseite jeweils den aktuellen Eintrag deines Weblogs verlinkt, d.h. der Linkname ändert sich sehr oft (täglich?).

Nun kann auch Google nicht alles crawlen, auch wenn Googlebot sehr fleißig ist. Daß Deine Dateien auf .shtml enden, ist, wie einige hier schon angemerkt haben, völlig egal. Google indiziert alles, nur bei dynamischen URLs (index.php?content=suchmich) indiziert er normalerweise nur die dynamischen Seiten, die von einer statischen verlinkt sind, dann hört er auf.

Das ist aber bei Dir nicht das Problem, sind ja alles "brave" URLs.

Meine Theorie wäre deswegen folgende:

  • Googlebot entscheidet nach Pagerank, wie weit er indiziert. Wenn eine Seite noch keinen Pagerank hat, indiziert er von der aus auch nicht weiter, wenn der Pagerank der Ausgangsseite nicht hoch genug ist
  • Googlebot kam also jeden Monat bei Dir vorbei, und hat die eine Seite indiziert, die von der Ausgangsseite verlinkt ist. Da die URL noch nicht in der Datenbank war, bekam sie erstmal nur den "geliehenen" Pagerank der Startseite, der erheblich niedriger ist, deswegen wird von da aus nicht weitergecrawlt. (Ich nehme an, daß Du keine externen Links hast, die auf Unterseiten verweisen)
  • die verlinkte Seite vom letzten Monat hat dann wahrscheinlich keine externen Links (in der Google-Datenbank) mehr, da sie ja auch von der Startseite des Weblogs verschwunden ist, und auch auf der zweiten, aktuell verlinkten Seite schon irgendwo unter "Archiv" o.ä. gelandest ist. Die bleibt dann noch ein bißchen in der Datenbank, ist aber für Google zu uninteressant, um von dortaus weiterzucrawlen. (Deswegen stehen immer einige Deiner "alten" Seiten in Google, das sind die, wo Google grade vorbeikam, als der Link auf der Startseite stand)
  • und nachdem das jeden Monat gleich abläuft, wird das so nix ;-)

Wenn Du also willst, daß Google Dich liebhat, behalte ein paar URLs bei, so wie es im Moment ist, sollte es eigentlich schon funktionieren, nachdem jetzt die Startseite schon die Links zu weiteren gleichbleiben URLs enthält.

Viele Grüße
Stephan