images.google per .htaccess aussperren?
Torsten
- webserver
Hallo,
ich möchte auf meinem Webspace die Google-Bildersuche ausschießen: und zwar soll jeder Besucher, der mit Referrer images.google* kommt, abgewiesen werden - besser noch: ich wollte als Ersatzbild das Google-Logo zurückliefern. Grund sind nervende Trafficklauer, die sich anscheinend ausschließlich über Google bei mir einfinden. Eine geänderte robots.txt brachte keine Besserung.
Ich hab schon einige Dokus zum Thema .htaccess gelesen, allerdings bekomme ich die Ausgestaltung mit den regular Expressions nicht richtig hin. Entweder werden alle User mit dem Google-Logo bedient oder gar keiner.
Ich bin bis zu dieser Lösung vorgedrungen, die jedoch Besucher von Google immer noch vorlässt:
RewriteEngine on
RewriteCond %{HTTP_REFERRER} images.google.*
RewriteRule (.*) http://www.google.com/intl/en/images/logo.gif
Was habe ich vergessen? Warum kommt man über die Google-Bildersuche immer noch auf meine Bilder?
Hallo!
Traffic-klauer sind Leute, die deine Bilder auf ihren Seiten einbetten, oder?
Dagegen hilft es nicht viel, images.google auszusperren, da du ja so auch nette Menschen rausschmeisst (und die Bösewichte können weiterhin deine Bilder einbetten, sie finden dich eventuell nur nicht mehr so häufig). Was du bräuchtest, wäre ein HotLink Schutz für deine Bilder, guck mal, ob dein Provider das anbietet.
Gruß,
Ruben
Doch, gegen meine Trafficklauer und Logzumüller wird das helfen. Die oben beschriebene Lösung ist genau das richtige für meine Bedürfnisse - ich müsste nur den Fehler in der Umsetzung beseitigen.
Doch, gegen meine Trafficklauer und Logzumüller wird das helfen. Die oben beschriebene Lösung ist genau das richtige für meine Bedürfnisse - ich müsste nur den Fehler in der Umsetzung beseitigen.
Lol..
Logzumüller
du hast dich gerade selbst Disqualifiziert...
TomIRL
du hast dich gerade selbst Disqualifiziert...
Ich hatte nicht vor mich zu qualifizieren - habe eine relativ eindeutige technische Frage gestellt.
Jetzt weiß ich lediglich, dass mindestens vier weitere Leute auch keine Antwort wissen.
du hast dich gerade selbst Disqualifiziert...
Ich hatte nicht vor mich zu qualifizieren - habe eine relativ eindeutige technische Frage gestellt.
Jetzt weiß ich lediglich, dass mindestens vier weitere Leute auch keine Antwort wissen.
Doch aus lauter Mitleid für Dich:
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^$
RewriteCond %{HTTP_REFERER} ^http://(www.)?image.google.de(/.*)?$ [NC]
RewriteRule .(gif|jpg|GIF|JPG)$ http://www.example.de/images/ersatz.gif [R,L]
Die URL wirst Du wohl noch selber austauschen können oder nicht?
Übrigens habe ich das Beispiel modifiziert von obiger von mir verlinkter Webseite übernommen.
Viel spaß noch
Korrektur..
Übrigens Self kommt von Selber machen.
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^http://(www.)?image.google.de(/.*)?$ [NC]
RewriteRule .(gif|jpg|GIF|JPG)$ http://www.example.de/images/ersatz.gif [R,L]
Die Syntax sieht eigentlich ok aus, aber Google zeigt die Bilder ja auch im Kontext der Seite an, wodurch der Referrer nicht mehr "images.google.*" lautet.
Außerdem wird der Referrer meines Wissens nicht immer übertragen, sondern ist vielmehr eine clientseitige Browsereinstellung, die man abschalten kann.
Vielleicht wäre es sinnvoller für Dich, den User-Agent auszulesen, auf googlebot zu prüfen und diesen umzuleiten bzw. einen 404er zu senden. Somit sollten deine Bilder gar nicht erst durch Google indiziert werden und nach ein-zwei Wochen aus dem Google-Index fliegen.
Die Syntax sieht eigentlich ok aus, aber Google zeigt die Bilder ja auch im Kontext der Seite an, wodurch der Referrer nicht mehr "images.google.*" lautet.
Danke für die Hilfe, aber das ist nicht korrekt. In meinen Logfiles sind die Referrer http://images.google.de/imgres?imgurl=http://www... zu finden.
Dass man Referrer abschalten kann, ist mir klar. Ich will schlicht die 100 täglichen Google-Referrer aus meinen Logfiles raushaben und die daraus resultierenden Forenlinks auch.
Hallo Torsten,
Ich will schlicht die 100 täglichen Google-Referrer aus meinen Logfiles raushaben und die daraus resultierenden Forenlinks auch.
Das ist verständlich und nachvollziehbar.
Und doch kommt es mir so vor, als hättest du etwas übersehen.
Ich habe keine Ahnung, was du auf deinem Server für Bilder hast, und warum die für die Internet-Gemeinde so interessant sein sollen. Aber wenn ich mich in die Rolle des Suchenden versetze, dann würde ich doch z.B. erstmal die Google-Bildersuche verwenden. Angenommen, dein Mechanismus funktioniert (warum das noch nicht so ist, kann ich dir leider auch nicht sagen), dann sehe ich also auf der Google-Ergebnisseite nur das Google-Logo anstatt des gesuchten Bildes. Das macht mich natürlich stutzig, und deshalb rufe ich die damit verlinkte Seite einfach mal direkt auf und sehe mir das Bild in seinem richtigen Kontext an. Aaah, da ist ja das Bild. Dann baue ich doch bei mir direkt einen Link auf dein Bild ein. Folglich bin ich in Zukunft einer deiner Trafficdiebe, und dein Ansatz, Google auszusperren, ist eigentlich nutzlos. Es ist meiner Ansicht nach genauso nutzlos, als würdest du den Namen vom Klingelschild entfernen, aber die Leuchtreklame "Bäckerei Wiedemann" [Name willkürlich gewählt] über dem Schaufenster dranlassen.
Oder was habe ich jetzt missverstanden?
Schönen Sonntag noch,
Martin
Hallo,
ich möchte auf meinem Webspace die Google-Bildersuche ausschießen: und zwar soll jeder Besucher, der mit Referrer images.google* kommt, abgewiesen werden - besser noch: ich wollte als Ersatzbild das Google-Logo zurückliefern. Grund sind nervende Trafficklauer, die sich anscheinend ausschließlich über Google bei mir einfinden. Eine geänderte robots.txt brachte keine Besserung.
Hallo,
sehr lustige Sache die Du da erzählst.
Wie sieht denn Deine robots.txt aus?
Normalerweise funktioniert das sehr zuverlässig.
Außerdem Trafikklau wird wohl kaum von Images.google verursacht.
Ich hab schon einige Dokus zum Thema .htaccess gelesen, allerdings bekomme ich die Ausgestaltung mit den regular Expressions nicht richtig hin. Entweder werden alle User mit dem Google-Logo bedient oder gar keiner.
Du solltest mit solchen Aktionen wie dem Google Logo vorsichtig sein.
Unter Umständen schießt Du Dir selbst ins Knie.
Was habe ich vergessen? Warum kommt man über die Google-Bildersuche immer noch auf meine Bilder?
ich habe einen Link zum Thema für Dich:
http://www.trafficklau.de/index1.html
TomIRL
Hallo,
die robots.txt ist seit Monaten angepasst, der googlebot kümmert sich nicht mehr drum, einige Bilder sind auch schon seit dem Sommer an der angegebenen Stelle überhaupt nicht zu finden - aber die Bilder sind nach wie vor in der Google-Datenbank. Die Bilder werden nämlich nur alle Schaltjahre neu aufgestellt.
Ich möchte wirklich nur die Abrufe mit dem Referrer images.google* sperren/umleiten.
Moin,
Hallo,
die robots.txt ist seit Monaten angepasst, der googlebot kümmert sich nicht mehr drum, einige Bilder sind auch schon seit dem Sommer an der angegebenen Stelle überhaupt nicht zu finden - aber die Bilder sind nach wie vor in der Google-Datenbank. Die Bilder werden nämlich nur alle Schaltjahre neu aufgestellt.
Deshalb solltest Du ja mal Dein robots Text Posten.
Ich möchte wirklich nur die Abrufe mit dem Referrer images.google* sperren/umleiten.
Offengestanden halte ich das für nicht gut, da Du aber nicht bereit bist mehr zu den Hintergründen zu erzählen, kann ich Dir auch nicht helfen.
Außerdem lese Dir die die Seite genau durch...
Die Lösung für Dein Problem wird Dir auf dem Silbertablett serviert.
Ein bißchen muß man sich aber die Beispiel dort schon ansehen.
TomIRL
Hallo!
RewriteEngine on
RewriteCond %{HTTP_REFERRER} images.google.*
RewriteRule (.*) http://www.google.com/intl/en/images/logo.gifWas habe ich vergessen? Warum kommt man über die Google-Bildersuche immer noch auf meine Bilder?
Erstmal gibt es die Variable die Du verwendest nicht: http://httpd.apache.org/docs/2.0/mod/mod_rewrite.html#rewritecond
Vielleicht hilft Dir auch der Abschnitt "Blocked Inline-Images" aus dem URL Rewriting Guide im Apache Manual.
Aber abgesehen davon lässt sich das Problem auf diese Art und Weise leider nicht lösen - zumindest wenn es Dir tatsächlich um die Logdatei (stattfindende Requests) und nicht um den Traffic geht. Denn diese Umleitung wird der "Googlebot-Image" nicht mitbekommen, da er nicht den gefilterten Referrer sendet. Entsprechend werden die Bilder weiterhin indiziert werden, sie werden weiterhin auf "images.google.de" gelistet, angezeigt und verlinkt. Erst die Anwender, die auf den Link klicken werden von der Umleitung betroffen sein. Aber diese Requests/Umleitungen werden jedesmal in den Logfiles verzeichnet werden. Und es werden auch nicht nennenswert weniger Requests werden, weil im Google-Listing ja noch alles normal aussieht (die Bilder werden auch in Zukunft dort gefunden und angezeigt), und vermutlich selten derselbe User mehrmals über die Bildsuche auf Deine Seite kommt.
Wie Du das geregelt bekommst sagt Dir google selbst:
http://images.google.de/intl/de/remove.html#images
Meines Wissens funktioniert das mit dem Ausschließen des Googlebots-Image wie angegeben, kann halt nur sein dass es ein bisschen länger dauert (Monate...) wenn der Seite eine geringe Bedeutung beigemessen wird.
Wenn Dir das zu lange dauert findest Du auf der verlinkten Hilfe-Seite auch einen Hinweis, wie Du die Bilder vorzeitig entfernen lassen kannst.
Grüße
Andreas