Sönke Tesch: Suchmaschinen und php

Beitrag lesen

wie werden eigentlich durch php generierte Seiten von den robots gefunden?
Warum nicht? die Seiten werden ja in HTML ausgegeben...??? *nixversteh*

Naja, im Verzeichnis liegt doch immer nur eine php Datei. Die HTML-Dateien werden aber erst bei Anforderung erstellt. Ich dachte die Suchrobots durchforsten nur die Verzeichnisstruktur.

Um Himmels Willen, nein! ;) Eine Suchmaschine durchforstest natürlich nicht die Verzeichnisse, denn sie hat genausowenig Zugriff auf den Webserver wie jeder andere (außer Dir) auch - garkeinen.
Eine Suchmaschine sieht für den Webserver genauso aus wie ein Webbrowser und verhält sich auch so: sie liest eine HTML-Seite, sucht sich die Verweise raus, liest dann diese Seiten und hangelt sich so von Webseite zu Webseite. Genauso, wie Du es auch mit einem Browser machen könntest, nur ein wenig schneller.

Eine PHP-Seite sieht übrigens für eine Suchmaschine ebenfalls nicht automatisch nach PHP aus, denn an den Client (Suchmaschine, Browser) wird nur das geliefert, was das PHP-Skript _ausgibt_, nicht das PHP-Skript selber.
Schau Dir mal eine "PHP-Seite" in Deinem Browser mittels "Quelltext anzeigen" an, Du wirst im Grunde keinerlei Unterschiede zu einer Seite feststellen können, die als echte HTML-Datei auf dem Server liegt.

Feststellen, was da unter der Adresse xy.de/z.php an Daten ausgeliefert wird, kann der Client nur, indem er a) darauf achtet, was der Webserver ihm als weitere Informationen zu diesen Daten gibt (Stichwort Content-Type und MIME-Typen, siehe auch http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.17) oder b) diese Daten selbst untersucht (eine unangenehme Eigenschaft des Internet Explorer).
Ein PHP-Skript kann also ohne weiteres neben HTML-Seiten auch irgendwelche Grafiken, Word-Dokumente oder sonstige Krankheiten ausspucken.

Gruß,
  soenk.e