Indizierung von .pdfs bei Google unterbinden?
Timo Geerlke
- sonstiges
Hi Leute, weiß jemand wie ich folgendes hinkriege?
Ich will verhindern, dass Google meine .pdf-Dokumente indiziert. Diese sind von einer HTML-Seite aus verlinkt.
Jetzt könnte ich natürlich <META NAME="robots" VALUE="noindex,nofollow"> (oder so ähnlich) in die HTML-Seite schreiben (habe ich mittlerweile auch gemacht), dafür ist's aber jetzt zu spät, Google hat sie schon indiziert und umbenennen will ich sie nicht (dann werden die Bookmarks der Besucher schließlich ungültig).
In der robots.txt auf dem Server kann ich leider nichts verändern.
Wie kriege ich die .pdfs da nun wieder raus?
Danke,
Timo
Hallo Timo,
Schau Mal bei Google vorbei - da steht einiges zu dem Thema und die bieten dir auch einen "Entfernungsservice"
http://www.google.de/intl/de/remove.html
Hi Timo,
- Jetzt könnte ich natürlich <META NAME="robots" VALUE="noindex,nofollow"> (oder so ähnlich) in die HTML-Seite schreiben (habe ich mittlerweile auch gemacht), dafür ist's aber jetzt zu spät, [...]
gut, dann warte ab, bis der Google-Indexer deine Seite erneut besucht - zumindest in der Theorie sollte er das Dokument dann aus dem Index entfernen. Wie Google das genau handhabt, weiß ich allerdings nicht.
Eine weitere Möglichkeit wäre, sofern du die Möglichkeit dazu hast, Rewrite-Regeln in einer .htaccess-Datei aufzustellen, die den HTTP-USER-AGENT des Googlebot (bzw. anderer Suchmaschinen) aussperrt. Dazu brauchst du allerdings einen Webserver mit mod_rewrite - wenn du wissen willst, wie das dann genau funktioniert, frage die Suchmaschine deines Vertrauens nach »RewriteCond HTTP_USER_AGENT«, da müsstest du einiges finden.
Bevor du allerdings diese durchaus rabiate Methode anwendest, würde ich wirklich warten, was der Googlebot zu deiner meta-Angabe sagt.
Viele Grüße
Benjamin