robtos.txt muss man auch bilderordner intergrieren?
rudi
- programmiertechnik
Hallo,
wie ist das mit der robots.txt Datei?
Ich habe mir den Artikel in Self HTML durchgelesen, kapiere trotzdem nicht alles.
Muss man Bilderordner auch ausschließen?
Hat irgendwer gute Beispiel robots.txt Dateien?
Danke schonmal.
Halihallo rudi
Muss man Bilderordner auch ausschließen?
Die Frage ist, ob _du_ den Bilderordnet ausschliessen möchtest. Willst du die
Bilderordner indizieren, dann nicht ausschliessen, willst du sie nicht indizieren lassen,
schliesse sie aus.
Die robots.txt sagt dem Roboter nur, ob und welche Ressourcen er indizieren soll. Es ist
allein _deine_ Aufgabe zu sagen, was für den Roboter (Suchmaschine) relevant sein könnte.
Ob du deine Bilder als relevant einstufen willst, ist deine Entscheidung.
Fakt ist, dass Bilder wie auch HTML-Dokumente Ressourcen sind und robots.txt definiert
die Verarbeitungsweise solcher; Fakt ist auch, dass viele Suchmaschinen die Bilder
per Definition nicht indizieren, da sie dieses Medium nicht erfassen.
Viele Grüsse
Philipp
Moin!
Die robots.txt sagt dem Roboter nur, ob und welche Ressourcen er indizieren soll.
Genau anders herum ist es richtig: Die robots.txt sagt dem Spider (und nur denen, die danach fragen - niemand wird daran gehindert, unfreundliche Spider zu schreiben, die sich nicht dran halten), auf welche Verzeichnisse er nicht zugreifen und sie somit nicht indizieren soll.
Es ist nicht möglich, in der robots.txt Angaben zu machen, welche Verzeichnisse _doch_ indiziert werden sollen, weil eben nur "Disallow" vorgesehen ist, nicht "Allow".
- Sven Rautenberg
Auch Moin!
Es ist nicht möglich, in der robots.txt Angaben zu machen, welche Verzeichnisse _doch_ indiziert werden sollen, weil eben nur "Disallow" vorgesehen ist, nicht "Allow".
Wobei man hier erwaehnen sollte, dass an einigen Stellen im Web - ich glaube auch in Selfhtml - die Moeglichkeit eines Allow genannt wird. Das bedeutet aber nicht, dass Du voellig debil bist *g*, sondern dass diese Moeglichkeit bisher nirgendwo standardisiert ist.[1] Es gibt lediglich einen Internet-Draft, in dem das Allow behandelt wird.
[1] Genaugenommen ist die robots.txt ueberhaupt nicht standardisiert. Es gibt aber einen "Konsens" darueber, der bis heute allgemein anerkannt ist: http://www.robotstxt.org/wc/norobots.html.
So long