php und robots.txt
jaba
- php
0 Sven Rautenberg0 Sönke Tesch0 jaba
hallo leute,
ich kann ja mit der robots.txt sagen, das die suchmaschienen bestimmte seiten nicht indexieren sollen.
wie sieht es aber aus, wenn ich zb die url index.php?item=10 in die robots reicnschreibe?
wird dann nur die seite mit dem item=10 nicht indexiert oder alle index seiten ?
danke schonmal im voraus
mfg
jaba
Moin!
ich kann ja mit der robots.txt sagen, das die suchmaschienen bestimmte seiten nicht indexieren sollen.
Nach meinem letzten Kenntnisstand kann man mit der robots.txt _Verzeichnisse_ ausschließen, aber keine Dateien.
wie sieht es aber aus, wenn ich zb die url index.php?item=10 in die robots reicnschreibe?
wird dann nur die seite mit dem item=10 nicht indexiert oder alle index seiten ?
Wenn eine einzelne Datei nicht indiziert werden soll, dann muß da ein passendes Meta-Tag rein:
<meta name="robots" content="noindex">
Übrigens: Suchmaschinen können sich dran halten (robots.txt und <meta>), oder es lassen. Gewißheit hast du da nie.
- Sven Rautenberg
ich kann ja mit der robots.txt sagen, das die suchmaschienen bestimmte seiten nicht indexieren sollen.
wie sieht es aber aus, wenn ich zb die url index.php?item=10 in die robots reicnschreibe?
Ein Blick in den Standard http://www.robotstxt.org/wc/norobots.html#method sagt ganz eindeutig folgendes:
Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved. For example, Disallow: /help disallows both /help.html and /help/index.html, whereas Disallow: /help/ would disallow /help/index.html but allow /help.html.
Bei Disallow /index.php?item=10 wird also dementsprechend nur diese Seite nicht indiziert, sowie alles, was sonst noch damit anfängt: /index.php?item=100, /index.php?item=1000, /index.php?item=10000, usw.
Davon abgesehen hast Du aber ein anderes Problem: Da das Dingen mit dem Fragezeichen eigentlich eher für dynamische Sachen gedacht war, also als Reaktion auf Benutzereingaben, und nicht als SSI für Arme, indizieren viele Suchmaschinen derartige Adressen überhaupt nicht.
Nun kann man sich natürlich darüber streiten, ob ein paar indizierende Suchmaschinen ausreichen, wenn z.B. Google darunter ist. Du solltest Dir aber trotzdem überlegen, ob Du den Suchmaschinen und Deinen Benutzern die Freude machst, sinnvolle Adressen zu verwenden, also zum Beispiel kino-fahrplan.de/programm/cinemaxx statt kino-fahrplan.de/index.php?id=50;art=253 . Mit Hilfe von mod_rewrite kann man erstere Art problemlos intern auf die zweite Version umschreiben, eine Änderung des internen Aufbaus der Seiten ist dafür nicht nötig.
Aber das nur so als Tipp.
Gruß,
soenk.e
Bei Disallow /index.php?item=10 wird also dementsprechend nur diese Seite nicht indiziert, sowie alles, was sonst noch damit anfängt: /index.php?item=100, /index.php?item=1000, /index.php?item=10000, usw.
Tausend dank soenk.e,
es handelt sich um foren, eines soll von google nicht indexiert werden;
so wie ich das verstehe ..url?forum=17 würden dann alle foren indexiert werden ausser forum 17 bzw 170 171 172.... , oder hab ich das falsch verstanden?
ich denke das würde mein problem erstmal lösen.
wer braucht schon 170 foren.
das mod_rewrite werd ich mir mal anschauen, danke für den tipp.
gruss
jaba
Bei Disallow /index.php?item=10 wird also dementsprechend nur diese Seite nicht indiziert, sowie alles, was sonst noch damit anfängt: /index.php?item=100, /index.php?item=1000, /index.php?item=10000, usw.
so wie ich das verstehe ..url?forum=17 würden dann alle foren indexiert werden ausser forum 17 bzw 170 171 172.... ,
So sollte es laut Standard sein, ein einfacher Textvergleich, ob die jeweilige Adresse mit dem verbotenen Teil anfängt oder nicht.
Gruß,
soenk.e