Michael Schröpl: shtml vs. html bei google

Beitrag lesen

Hi guido,

google indiziert ja bekanntlich php-seiten nicht so gerne wie html-seiten.

wäre ich der Googlebot, dann würde ich diejenigen Informationen auswerten, die etwas taugen.

Der Name der Datei taugt in diesem Falle nichts, weil Du natürlich beliebige Mappings zwischen Endungen und Handlern vornehmen und noch dazu die wahren Endungen über Server Negotiation verstecken kannst (link auf "x.html", die Datei heißt aber tatsächlich "x.html.shtml").

Was ein HTTP-Client aber sehr wohl sehen kann, das sind HTTP-Header. Beispielsweise: "Last-Modified:" oder "ETag:". Beides kann er dazu heranziehen, zu erkennen, ob eine Seite _wahrscheinlich_ einen dynamischen oder einen statischen Inhalt besitzt - und wenn er etwas gegen dynamische Inhalte hat (weil er befürchtet, daß dann sein Index mit ständig veralteten Informationen gefüllt ist und seine Besucher sich über diese Fehlinformationen ärgern werden), dann kann er solche Seiten natürlich ignorieren.
Gegen das fehlende ETag kann man meines Wissens nichts tun - gegen das fehlende Änderungsdatum schon (Apache-Direktive "XBitHack"). Letzteres würde beispielsweise auch die Motivation bestimmter Proxy-Server (und ggf. sogar bestimmter Browser?) erhöhen, eine derartige Seite in ihrem Cache zu halten - das ist also ohnehin eine sinnvolle Idee.

ich suche nach einer suchmaschinenfreundlichen loesung, geparste seiten zu bauen - und php ist da ja nicht ganz so beliebt, habe ich gehoert...

Es gibt Gründe dafür, so etwas nicht zu indizieren - in der Tat.

Wenn Deine Seiten dynamisch bezüglich des Inhalts sind, solltest Du sie via robots-Mechanismus vor Suchmaschinen verstecken; sind sie nur dynamisch bezüglich ihrer Baukasten-Natur, dann tarne sie so gut wie möglich (siehe oben).

Viele Grüße
      Michael

--
T'Pol: I apologize if I acted inappropriately.
V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
(sh:| fo:} ch:] rl:( br:^ n4:( ie:% mo:) va:| de:/ zu:| fl:( ss:) ls:~ js:|)