Hi alle,
auf einem Projekt, das ich technisch betreue, tummelt sich anscheinend ein seltsamer Bot. Der tarnt sich mit einem harmlosen user_agent ("Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"), nudelt ohne Unterlass im Sekundentakt alle Unterseiten der Reihe nach durch und wechselt dabei immer wieder mal die IP. Die Rückverfolgung dieser IPs bringt nichts, die führen in die ganze Welt.
Aufgefallen ist mir dieser Bot besonders, weil er auch vor Formularen nicht Halt macht. Dabei füllt er alle Felder mit irgendeinem Zeichensalat, also offenbar nicht in dem Versuch, dabei Spam zu versenden. Ähnliche Zeichensalat-Mails ohne erkennbaren Zweck kenne ich auch schon aus anderen Projekten, da dürfte also ein ähnliches Vieh unterwegs sein. Aus den Kontaktformularen halte ich ihn derzeit durch recht simple Captchas raus.
Meine Frage ist zunächstmal: Was wird damit eigentlich bezweckt? Ist das irgendein Tool, das ein Konkurrent nutzt, um auf dem Laufenden zu bleiben, was sich auf den Seiten tut? Um meine Datenbank "auszusaugen"?
Und dann natürlich: Was tut man dagegen? Auf Basis seines aktuellen Verhaltens (Zeichensalat, Klickfrequenz, seltener IP-Wechsel) könnte ich mir schon einen Algorithmus vorstellen, der in weitgehend rausfiltert. Umgekehrt wäre das recht leicht zu umgehen: echte Wörter eingeben, Hits auf mehr IPs verteilen. Deswegen zweifle ich, ob sich die Mühe lohnen würde.
Nun bin ich wohl kaum er Erste, der dieses Problem hat und bemerkt. Kann ich irgendwo mehr über dieses Ding und ggf. geeignete Abwehrmaßnahmen erfahren?
Danke schonmal!
Janne