shtml vs. html bei google
guido bayer
- sonstiges
hi,
google indiziert ja bekanntlich php-seiten nicht so gerne wie html-seiten.
wie steht es denn mit shtml-seiten? werden die "lieber" indiziert als php-seiten, vielleicht sogar gleich behandelt wie html-seiten?
ich suche nach einer suchmaschinenfreundlichen loesung, geparste seiten zu bauen - und php ist da ja nicht ganz so beliebt, habe ich gehoert...
guido bayer
Hallo,
das liegt nicht an php ob google eine seite "mag" oder nicht, sodern daran, wie deine uri ausieht. www.foo.org/page.php?a=4r243242&fsfsff=3343&fwr=werw|fdf|sf etc. ist nicht so "freundlich" wie www.foo.org/pfad/zur/seite.php.
frag mal google z.b. nach search engine friendly urls, da wird sich einiges finden lassen.
http://www.google.de/search?hl=de&ie=UTF-8&oe=UTF-8&q=search+engine+friendly+urls&btnG=Google-Suche&meta=
Mit freundlichen Grüßen,
Andreas Waidelich
Hallo Guido!
google indiziert ja bekanntlich php-seiten nicht so gerne wie html-seiten.
Ist das mehr als ein Gerücht?
ich suche nach einer suchmaschinenfreundlichen loesung, geparste seiten zu bauen - und php ist da ja nicht ganz so beliebt, habe ich gehoert...
Was man so hört...
Hast du die Möglichkeit, deinen Server so zu konfigurieren, dass auch Dokument mit der Endung .html geparst werden?
Gruß,
MI
Hallo,
google indiziert ja bekanntlich php-seiten nicht so gerne wie html-seiten.
Hast du die Möglichkeit, deinen Server so zu konfigurieren, dass auch Dokument mit der Endung .html geparst werden?
MultiViews (»Options +MultiViews« in einer Datei namens .htaccess) und die Endung .html.php wären wahrscheinlich einfacher zu realisieren. Die Adressen würden dann öffentlich auf .html enden.
Grüße,
Mathias
Hi!
ich suche nach einer suchmaschinenfreundlichen loesung, geparste seiten zu bauen - und php ist da ja nicht ganz so beliebt, habe ich gehoert...
IMHO ist alles was man von diesen Dingen noch hört "Schmarn von gestern". Google hat genausowenige probleme mit komplexen urls wie Browser, google hat lediglich was dagegen Seiten zu indizieren, die sich zu oft ändern, das würde nämlich heißen der Suchbegriff unter dem die Seite gefunden wird gar nicht mehr auf der Seite existiert, also dass man viele irrelevanten Ergebnisse im Index stehen hat. Stört sich nicht an der URL, es indiziert auch Seiten mit Parametern (www.server.de/script.php?a=123&page=12344...) das ist vollkommen OK. NUr wenn google bemerkt das sich ie Inhalte zu häufig ändern kommt die Seite wieder raus, bzw. je nach Seite wird diese dann öfter besucht, wie z.B. Nachrichtenseiten, die dann immer recht aktuell im Index stehen. Ob die Parameter jetzt in der URL stehen, oder die Datei auf .html, .shtml, .php, .pl oder sonstwie enden ist ziemlich egal.
Grüße
Andreas
Hi guido,
google indiziert ja bekanntlich php-seiten nicht so gerne wie html-seiten.
wäre ich der Googlebot, dann würde ich diejenigen Informationen auswerten, die etwas taugen.
Der Name der Datei taugt in diesem Falle nichts, weil Du natürlich beliebige Mappings zwischen Endungen und Handlern vornehmen und noch dazu die wahren Endungen über Server Negotiation verstecken kannst (link auf "x.html", die Datei heißt aber tatsächlich "x.html.shtml").
Was ein HTTP-Client aber sehr wohl sehen kann, das sind HTTP-Header. Beispielsweise: "Last-Modified:" oder "ETag:". Beides kann er dazu heranziehen, zu erkennen, ob eine Seite _wahrscheinlich_ einen dynamischen oder einen statischen Inhalt besitzt - und wenn er etwas gegen dynamische Inhalte hat (weil er befürchtet, daß dann sein Index mit ständig veralteten Informationen gefüllt ist und seine Besucher sich über diese Fehlinformationen ärgern werden), dann kann er solche Seiten natürlich ignorieren.
Gegen das fehlende ETag kann man meines Wissens nichts tun - gegen das fehlende Änderungsdatum schon (Apache-Direktive "XBitHack"). Letzteres würde beispielsweise auch die Motivation bestimmter Proxy-Server (und ggf. sogar bestimmter Browser?) erhöhen, eine derartige Seite in ihrem Cache zu halten - das ist also ohnehin eine sinnvolle Idee.
ich suche nach einer suchmaschinenfreundlichen loesung, geparste seiten zu bauen - und php ist da ja nicht ganz so beliebt, habe ich gehoert...
Es gibt Gründe dafür, so etwas nicht zu indizieren - in der Tat.
Wenn Deine Seiten dynamisch bezüglich des Inhalts sind, solltest Du sie via robots-Mechanismus vor Suchmaschinen verstecken; sind sie nur dynamisch bezüglich ihrer Baukasten-Natur, dann tarne sie so gut wie möglich (siehe oben).
Viele Grüße
Michael