Das Problem ist nun, dass der Googlebot seit kurzem andauernd vorbeikommt. Das heißt, er kommt zumindest einmal täglich
Das Problem habe ich ebenfalls, wenn auch nicht ganz so extrem (oder es ist mir noch nicht so aufgefallen).
Es gibt auch einige komplett statische .html-Seiten, welche er entsprechend seltener crawlt, weil der Server deren Last-Modified kennt.
Hast Du mal versucht, nur für den GoogleBot (User-Agent) eine irgendwie halbwegs passende Last-Modified-Angabe zu senden? Sie muß ja nicht exakt stimmen.
Aber auch mit denen habe ich Probleme, denn Google sendet zwar brav einen Conditional GET, dann aber direkt danach einen gewöhnlichen, nach folgendem Schema:
Sei froh, daß er bei Dir überhaupt If-Last-Modified sendet ;) Andere Leute werden gleich plattgewalzt..
Wenn ich beispielsweise output buffering verwende, würde es etwas helfen, wenn ich einen ETag durch MD5 generiere
Rein vom Gefühl her würde ich mir von einer Zeitangabe (eben Last-Modified) mehr versprechen, denn eine Prüfsumme sagt eher noch weniger als Last-Modified darüber aus, wie oft sich ein Neubesuch lohnt. Wie dem auch sei: Probieren geht über studieren.
Vielleicht solltest Du Dich auch mal bei Google beschweren. Du bist nicht der einzige, der von Google terrorisiert wird, vielleicht merken die ja irgendwann mal was.
Gruß,
soenk.e