Wie schnell ist ein Spamrobot?
Onkel Schnitzel
- html
0 Christoph Schnauß0 Onkel Schnitzel0 bleicher0 Qwald0 Chris0 Sven Rautenberg0 Christoph Schnauß
0 Hamster
0 Cheatah
Hallo,
wie lange braucht eigentlich ein Spamrobot, bis er eine Seite - nehmen wir jetzt mal eine 0815-Impressums-Seite - auf Mail-Adressen hin untersucht hat? Das läuft doch wahrscheinlich innerhalb von Zehntelsekunden ab, immerhin soll die Maschine ja was schaffen. Und nach diesen 0,XXX Sekunden verschwindet der doch wieder von der Seite, ist das richtig?
Schöne Grüße,
Onkel Schnitzel
hallo,
wie lange braucht eigentlich ein Spamrobot, bis er eine Seite - nehmen wir jetzt mal eine 0815-Impressums-Seite - auf Mail-Adressen hin untersucht hat? Das läuft doch wahrscheinlich innerhalb von Zehntelsekunden ab, immerhin soll die Maschine ja was schaffen. Und nach diesen 0,XXX Sekunden verschwindet der doch wieder von der Seite, ist das richtig?
Du mußt dir einfach mal den log-Eintrag anschauen, den so ein bot hinterläßt. Das sieht beispielsweise so aus:
69.31.80.114 - - [11/Oct/2006:08:34:20 +0200] "GET /kontakt/gastb.php?add HTTP/1.0" 200 3773 "http://www.christoph-schnauss.de/kontakt/gastb.php?add" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)"
203.177.231.209 - - [11/Oct/2006:08:35:06 +0200] "POST /kontakt/gastb.phptemp HTTP/1.0" 404 2106 "http://www.christoph-schnauss.de/kontakt/gastb.php?add" "-"
Er hat hier immerhin volle 46 Sekunden gebraucht, wollte mein Gästebuch vollmüllen, hat am Ende aber doch nur einen 404er zurückbekommen.
Grüße aus Berlin
Christoph S.
Er hat hier immerhin volle 46 Sekunden gebraucht, wollte mein Gästebuch vollmüllen, hat am Ende aber doch nur einen 404er zurückbekommen.
Wow! Die geben sich so viel Mühe? Dann kann ich meine Idee wohl wieder fallen lassen. Ich wollte, so wie wahsaga, die Mail-Adressen erst nach dem Klick auf einen Formular-Button sichtbar machen. Wollte das aber mit einer Zeitsperre kombinieren, weil ich angenommen hatte, dass so ein Robot nach spätestens einer Sekunde wieder weg ist, während der Mensch ja doch ein paar Sekunden länger braucht, bis er sich den Text des Buttons usw. durchgelesen hat. Schade...
Beste Grüße,
Onkel Schnitzel
gbt es iwnet eine seite über spambots? würde mcih iunteressieren wie diese funktionieren (grobgeshen ;)
MFG
bleicher
hallo bleicher,
gbt es iwnet eine seite über spambots?
Grüße aus Berlin
Christoph S.
woo.. die sind aber Zynisch "auch bei der Angabe der Mail adressen in Bild und Ton wären Taubstumme ausgeschlossen" ;(
MFG
bleicher
Hallo,
ich mach das immer so: Ich erstell eine Grafik mit dem Text meiner Email-Addy und transparentem Hintergrund. Dabei ist die Grafik genauso hoch wie eine normale Textzeile.
Dann in der Imp-Seite steht: Email: <img src="mein_mail.gif">
Sieht für den User aus, als wäre es normal Text, aber ich denke mal nicht, dass Bots sich die Mühe machen, und Grafiken nach Email Addys durchsuchen.
MFG
Dann in der Imp-Seite steht: Email: <img src="mein_mail.gif">
Sieht für den User aus, als wäre es normal Text, aber ich denke mal nicht, dass Bots sich die Mühe machen, und Grafiken nach Email Addys durchsuchen.
Die Lösung mit den Bildern ist natürlich möglich, aber nicht ganz sauber bzw. barrierefrei. Und streng genommen müsste man ja auch einen Alternativ-Text mit angeben.
Hallo,
Die Lösung mit den Bildern ist natürlich möglich, aber nicht ganz sauber bzw. barrierefrei. Und streng genommen müsste man ja auch einen Alternativ-Text mit angeben.
das ist klar, allerdings sind nur wenige Möglichkeiten wirklich barrierefrei, die ein Spambot nicht sofort knacken kann.
MFG
Die Lösung mit den Bildern ist natürlich möglich, aber nicht ganz sauber bzw. barrierefrei. Und streng genommen müsste man ja auch einen Alternativ-Text mit angeben.
das ist klar, allerdings sind nur wenige Möglichkeiten wirklich barrierefrei, die ein Spambot nicht sofort knacken kann.
Barrierefreiheit wird immer dann verletzt, wenn man die vermuteten Bots zu Aufgaben zwingen will, die nur Menschen lösen können. Die beiden Konzepte (Barrierefreiheit und Bot-Isolierung) beissen sich.
Hallo Hamster,
Die beiden Konzepte (Barrierefreiheit und Bot-Isolierung) beissen sich.
Nicht unbedingt: Man kann den Client z. B. eine kleine Rechenaufgabe lösen lassen oder ein Auswahlfeld machen, wo man auswählen kann "ich will nur spammen" / "ich will wirklich was schreiben".
Wenn auch Bots manchmal besser Bilder lesen können als manche Menschen; denken können Menschen weitaus besser als jeder Computer.
Viele Grüße aus Freiburg,
Marian
Die beiden Konzepte (Barrierefreiheit und Bot-Isolierung) beissen sich.
Nicht unbedingt: Man kann den Client z. B. eine kleine Rechenaufgabe lösen lassen
Es soll auch Nichtrechner unter uns geben, so zu sagen Antinumeriker.
oder ein Auswahlfeld machen, wo man auswählen kann "ich will nur spammen" / "ich will wirklich was schreiben".
Auch daran kann jemand scheitern.
Wenn auch Bots manchmal besser Bilder lesen können als manche Menschen; denken können Menschen weitaus besser als jeder Computer.
Nicht ganz klar, die Playstation z.B. soll schon die Rechenkapazität des Menschen in einem einstelligen Prozentbereich leisten können.
Hallo Hamster,
Nicht unbedingt: Man kann den Client z. B. eine kleine Rechenaufgabe lösen lassen
Es soll auch Nichtrechner unter uns geben, so zu sagen Antinumeriker.
Es geht hier um Aufgaben à la 'sieben plus drei minus fünf', aber auch das kann man notfalls in einen Taschenrechner eingeben.
oder ein Auswahlfeld machen, wo man auswählen kann "ich will nur spammen" / "ich will wirklich was schreiben".
Auch daran kann jemand scheitern.
Wenn man ein ganz normales Formular aufüllen kann, kriegt man das ja wohl grad noch hin.
Auf jeden Fall können mehr Menschen die beiden genannten Aufgaben lösen als ein Captcha.
Viele Grüße aus Freiburg,
Marian
hi,
ich mach das immer so: Ich erstell eine Grafik mit dem Text meiner Email-Addy und transparentem Hintergrund. Dabei ist die Grafik genauso hoch wie eine normale Textzeile.
Woher willst du wissen, wie hoch bei mir eine Zeile ist?
Sieht für den User aus, als wäre es normal Text
Spätestens, wenn der Nutzer diese Mailadresse verwenden will, wird er merken, dass sie eben doch nur ein Bild und kein Text ist - weil er mit an Sicherheit grenzender Wahrscheinlichkeit zuerst versuchen wird, sie zu kopieren, anstatt sie abzutippen.
gruß,
wahsaga
Das muss nicht wirklich langsam oder gründlich sein. es kann auch einfach nur ein zeitintervall für die pausen zwischen den seitensprüngen integriert sein. solche bots werden vermutlich mehr als nur eine seite parallel durchsuchen..
beste grüße
Chris
Moin!
Dann kann ich meine Idee wohl wieder fallen lassen. Ich wollte, so wie wahsaga, die Mail-Adressen erst nach dem Klick auf einen Formular-Button sichtbar machen. Wollte das aber mit einer Zeitsperre kombinieren, weil ich angenommen hatte, dass so ein Robot nach spätestens einer Sekunde wieder weg ist, während der Mensch ja doch ein paar Sekunden länger braucht, bis er sich den Text des Buttons usw. durchgelesen hat. Schade...
Wären Spider so schnell, wie du glaubst, dann würden sie jeden Webserver in kurzer Zeit mit einer Masse an Requests überlasten - und sich dadurch identifizierbar und sperrbar machen, weil sie den tatsächlichen Betrieb des Servers beeinträchtigen würden. Das würde man merken können.
- Sven Rautenberg
hallo,
Wow! Die geben sich so viel Mühe? Dann kann ich meine Idee wohl wieder fallen lassen. Ich wollte, so wie wahsaga, die Mail-Adressen erst nach dem Klick auf einen Formular-Button sichtbar machen. Wollte das aber mit einer Zeitsperre kombinieren, weil ich angenommen hatte, dass so ein Robot nach spätestens einer Sekunde wieder weg ist
Es ist ein weitverbreitetes Mißverständnis, daß die "Spione" auf Webseiten nach irgendwelchen mail-Adressen suchen. Sicher, manche tun das, viel wichtiger sind ihnen aber Formularfelder, die irgendwie "mail" oder "name" oder "submit" heißen. Die versuchen sie auszufüllen bzw. solche buttons auszulösen. Ich habe nochmal aktuelle log-Beispiele von einer anderen Adresse:
203.87.210.218 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
203.131.159.251 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
60.52.50.90 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
202.156.9.2 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
219.92.92.236 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
210.213.174.215 - - [13/Oct/2006:10:37:14 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
219.95.235.84 - - [13/Oct/2006:10:37:14 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
202.133.219.90 - - [13/Oct/2006:10:37:22 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
Ich habe die Referer gekürzt, auf die kommt es hier nicht an. Interessant ist hier, daß der Spion ein anderes Formular gefunden hat - und diesmal gibts eine 200er Meldung, es ist also was passiert. Allerdings nichts Schlimmes, er hat lediglich eine Aufforderung erhalten, ein anderes Formular zu benutzen, was ihn überfordert. Mehr ist nicht abgeschickt worden (das Script muß ich trotzdem revidieren, weil auch das nicht gewünscht ist). Aber du siehst hier bereits ansatzweise, was Sven angesprochen hat: würde der bot nun munter in sehr kurzen Abständen weitermachen, wird die Serverlast höher, und obwohl sehr schnell die IP gewechselt wird, steigt damit die Gefahr der Identifizierung für den Spion. Also hört er wieder auf, wenn er meint, ausreichend Erfolg erzielt zu haben. Es nutzt übrigens wenig, hier nachschauen zu wollen, wohin die angegebenen IP-Adressen gehören (Australien, Malaysia, Philippinen).
Wenn die Spamer mail-Adressen erfahren wollen, nutzen sie vorzugsweise andere Mechanismen.
Grüße aus Berlin
Christoph S.
Er hat hier immerhin volle 46 Sekunden gebraucht, wollte mein Gästebuch vollmüllen, hat am Ende aber doch nur einen 404er zurückbekommen.
Bei einem gut geschützten Gästebuch braucht ein Bot natürlich wesentlich länger als bei einem Wald und Wiesengästebuch.
Ich habe mal von einem Gästebuch gehört, da kam ein Bot jeden Tag aufs Neue vorbei und versuchte was anderes.
hallo Hamster,
Ich habe mal von einem Gästebuch gehört, da kam ein Bot jeden Tag aufs Neue vorbei und versuchte was anderes.
Interessant. Es ist natürlich vollkommen ausgeschlossen, daß damit meins gemeint sein konnte.
Grüße aus Berlin
Christoph S.
Hi,
Und nach diesen 0,XXX Sekunden verschwindet der doch wieder von der Seite, ist das richtig?
was meinst Du mit "von der Seite verschwinden"?
Cheatah
was meinst Du mit "von der Seite verschwinden"?
Nunja, ich weiß ja nicht, wie diese Robots arbeiten. Ich dachte, die nehmen sich eine Seite vor, durchsuchen sie nach Mailadressen und ziehen dann, wenn sie den Quelltext durchgearbeitet haben, zur nächsten Seite weiter.
was meinst Du mit "von der Seite verschwinden"?
Nunja, ich weiß ja nicht, wie diese Robots arbeiten. Ich dachte, die nehmen sich eine Seite vor, durchsuchen sie nach Mailadressen und ziehen dann, wenn sie den Quelltext durchgearbeitet haben, zur nächsten Seite weiter.
Im Prinzip stellt man sich im allgemeinen unter einem Spam-Bot einen unmoralischen Robot wie zum Beispiel Bender vor, der einfach mal so unaufgefordert eine Seite besucht, darauf ein wenig (10 Minuten sollten aber reichen) herumvagabundiert und dann entweder unverrichteter Dinge weiterzieht oder für seinen ebenfalls unmoralischen Bruder, der bspw. Sexseiten betreit, ein wenig Reklame macht.