robots
shadowhunter
- browser
Hello!
Wie kann ich mit Hilfe robots mein Gästebuch vor Suchmaschinen schützen. Ich weiss es im allgemeinen wie es funktioniert.
Da aber mein Gästebuch nicht im selben Verzeichnis wie meine Webseite ist, weiss ich nicht wie weiter.
Aufbau meines Servers:
Meine Webseite: server/html/SITE/index.htm
Mein Gästebuch: server/html/GB/index.php
Mein Gästebuch kann ich nicht gut verschieben, da es mit diesem Verzeichnis installiert ist!
Wie kann ich mein Gästebuch schützen vor den Suchmaschinen?
Im einfachsten Sinn würde es wie folgt funktionieren:
User-agent: *
Disallow: /gb/
Weil aber das Gästebuch nicht im selben Verzeichnis (Unter-) exisitert, könnte man dann einfach "../gb/" schreiben?
greez
Hallo.
Der Pfad in der robots.txt richtet sich nach dem Pfad, wie das Gästebuch zu erreichen ist. Eine Suchmaschine kann ja nicht auf die Pfade des Webserver zugreifen, sondern nur auf Adresspfade.
www.DeineDomain.de hat als DocumentRoot /server/html/SITE/
Aber wie kommt der Webserver inserver/html/GB/ ? Via Link im Dateisystem?
Grüße aus Würzburg
Julian
Ich weiss eigentlich auch nicht, wie die Suchmaschine auf mein Gästebuch kommt. Aber mein Gästebuch ist mit www.accessprotect.com gesichtert. Vieleicht ist so die verlinkung passiert.
Ja, via Link im Dateisystem! (www.serveradresse.com/GB)
Jedenfall habe bin ich letztlich in google auf mein Gästebuch gestossen!
Im Ordner server/html/GB/ habe ich eine robots datei mit folgendem inhalt:
#robots.txt
User-agent: *
Disallow: /
Würde dies funktionieren?
WIE kann ich mein Gästebuch aus dem google-such-index entfernen?
1000x Merci!
greez
Hallo.
Würde dies funktionieren?
Nein, da Suchmaschinen die robots.txt nur als www.domain.de/robots.txt suchen. Ein Eintrag
#robots.txt
User-agent: *
Disallow: /GB/
sollte daher dort genügen (zumindest für Robots, die die Datei berücksichtigen).
WIE kann ich mein Gästebuch aus dem google-such-index entfernen?
http://www.google.de/support/webmasters/bin/answer.py?answer=35301&topic=8459
Grüße aus Würzburg
Julian
Hi,
Aber mein Gästebuch ist mit www.accessprotect.com gesichtert.
gesichert würde ich nicht dazu sagen. Lediglich die URL wird von diesem Service erst nach Passwortabfrage rausgerückt und da Suchmaschinen keine Login-Formulare hacken, stammt die Verlinkung bestimmt nicht von dort.
Trage die URL, auf die accessprotect weiterleitet, in der robots.txt ein.
Oder besser: Schütze Dein Gästebuch richtig, z.B. über die .htaccess.
freundliche Grüße
Ingo
ich weiss, dass nur die url gesichert wird. aber dies reicht im moment!
Trage die URL, auf die accessprotect weiterleitet, in der robots.txt ein.
Was meinst du damit? Wie muss das sein? Welche URL meinst du (AP oder Ziel URL)
Oder besser: Schütze Dein Gästebuch richtig, z.B. über die .htaccess.
Kann ich eine .htaccess anlegen, welche mit accessprotect "zusammenarbeitet" (wenn erfolgreicher login bei AP, dann .htaccess gibt zugriff frei)!
Kann man dies irgendwie realisieren?
Vielen dank für deine beteiligung
greez
Hi,
Oder besser: Schütze Dein Gästebuch richtig, z.B. über die .htaccess.
Kann ich eine .htaccess anlegen, welche mit accessprotect "zusammenarbeitet" (wenn erfolgreicher login bei AP, dann .htaccess gibt zugriff frei)!
Kann man dies irgendwie realisieren?
nein. Aber ein Passwortschutz über die .htaccess macht die Passwortabfrage bei accessprotect (die ihren Service besser loginservice nennen sollten, denn geschützt wird hier ja nichts) erst recht unnötig.
In der robots.txt trägst Du das (hoffentlich) geschützte Verzeichnis ein.
freundliche Grüße
Ingo
In der robots.txt trägst Du das (hoffentlich) geschützte Verzeichnis ein.
Mein geschütztes Verzeichnis mit AP: "server/html/cgi-bin/GB/index.php"
#robots.txt im Verzeichnis cgi-bin:
User-agent: *
Disallow: /gb/
Dies sollte doch so funktionieren?
Schönes weekend!
mfg
Hi,
Mein geschütztes Verzeichnis mit AP: "server/html/cgi-bin/GB/index.php"
#robots.txt im Verzeichnis cgi-bin:
User-agent: *
Disallow: /gb/Dies sollte doch so funktionieren?
Nein, das ist dreifach falsch.
1. die robots.txt gehört in Root
2. /gb/ gibt an, dass sich dieses Verzeichnis direkt unterhalb des Root befindet
3. gb != GB
Wenn Dein Root /server/html/ ist, dann speicherst Du dort die robots.txt und trägst /cgi-bin/GB/ ein.
freundliche Grüße
Ingo