ich kann ja mit der robots.txt sagen, das die suchmaschienen bestimmte seiten nicht indexieren sollen.
wie sieht es aber aus, wenn ich zb die url index.php?item=10 in die robots reicnschreibe?
Ein Blick in den Standard http://www.robotstxt.org/wc/norobots.html#method sagt ganz eindeutig folgendes:
Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved. For example, Disallow: /help disallows both /help.html and /help/index.html, whereas Disallow: /help/ would disallow /help/index.html but allow /help.html.
Bei Disallow /index.php?item=10 wird also dementsprechend nur diese Seite nicht indiziert, sowie alles, was sonst noch damit anfängt: /index.php?item=100, /index.php?item=1000, /index.php?item=10000, usw.
Davon abgesehen hast Du aber ein anderes Problem: Da das Dingen mit dem Fragezeichen eigentlich eher für dynamische Sachen gedacht war, also als Reaktion auf Benutzereingaben, und nicht als SSI für Arme, indizieren viele Suchmaschinen derartige Adressen überhaupt nicht.
Nun kann man sich natürlich darüber streiten, ob ein paar indizierende Suchmaschinen ausreichen, wenn z.B. Google darunter ist. Du solltest Dir aber trotzdem überlegen, ob Du den Suchmaschinen und Deinen Benutzern die Freude machst, sinnvolle Adressen zu verwenden, also zum Beispiel kino-fahrplan.de/programm/cinemaxx statt kino-fahrplan.de/index.php?id=50;art=253 . Mit Hilfe von mod_rewrite kann man erstere Art problemlos intern auf die zweite Version umschreiben, eine Änderung des internen Aufbaus der Seiten ist dafür nicht nötig.
Aber das nur so als Tipp.
Gruß,
soenk.e