Thomas Luethi: Suchmaschinen sollen diese HTML-Seite nicht finden

Beitrag lesen

Hallo,

Wie schaffe ich es, dass Suchmaschienen eine HTML-Seite nicht finden.

Lass sie zuhause auf Deinem eigenen Rechner.
Lade sie nicht auf einen Webserver hoch.

Also, dass man diese nur erreichen kann, wenn man auch die Adresse kennt, bzw. wenn sie verlinkt ist?

"Geheime URL" ist ein sehr schwacher "Schutz".
Sobald eine Seite Links nach aussen hat, taucht
ihre URL z.B. auch in den Logfiles von anderen
Websites auf, und evtl. machen deren Autoren
dann einen Link auf Deine Seite. Oder sonst jemand
macht einen Link auf Deine Seite, ohne dass Du
es sofort erfaehrst. Auf das Konzept
"geheime URL => wird nicht gefunden"
kannst Du also nicht zaehlen.

Die schon erwaehnten Meta-Tags sowie die robots.txt
sind die gaengigen Versuche, die Robots fernzuhalten
bzw. den Suchmaschinen zu verbieten, Seiten zu
indizieren.

Gemaess meiner Erfahrung missachtet Google die robots.txt,
und besucht auch die dort "verbotenen" Verzeichnisse, z.B.
wenn Links von aussen direkt auf eine solche Seite zeigen.
Wenn dann in den Seiten ein Meta-Tag im Stil
<META NAME="robots" CONTENT="index,follow">
steht, indiziert er die Seiten, obwohl er sie gemaess der robots.txt
gar nicht haette besuchen duerfen.

Eine Kombination von Verboten in der robots.txt sowie
in den Meta-Tags duerfte wohl fuer Google und einige
andere Suchmaschinen funktionieren.

Etwas sicherer ist es, das Verzeichnis mit einem Passwortschutz
zu versehen und die Kombination Benutzername/Kennwort
auf der Seite anzugeben, von der aus man verlinkt.
Oder auch im "Realm"-Text, der im Passwort-Eingabe-Fensterchen
erscheint. Dann koennen "menschliche" Besucher diese Angaben
abtippen, aber "normal intelligente" Spider bleiben draussen.

Der einzig wirksame Schutz vor Suchmaschinen-Spidern
und anderen Robots ist aber wie gesagt, dass man die
Seiten gar nicht erst online stellt.

Zu robots.txt und zum Robots-Meta-Tag:
http://www.robotstxt.org/wc/exclusion.html

Zu Google:
http://www.google.com/bot.html
http://www.google.de/webmasters/faq.html

Gruesse,

Thomas

--
Bitte keine Mails mit Fachfragen - dafuer gibt es das Forum!
Ich mag es, wenn URLs verlinkt sind (</faq/#Q-19>).
Oft gestellte PHP-Fragen beantwortet die dclp-FAQ bestens: http://www.dclp-faq.de/