Testergebnis: Unicode-maskierte Mailadressen
rob
- zur info
Salvete!
Vor längerer Zeit hatten wir hier mal die Diskussion, ob es sinnvoll ist, Mailadressen zu codieren, indem man die Zeichen durch Unicodemaskierungen ersetzt und ich wollte einen Versuch dazu starten. Nun das Ergebnis.
Ich habe zwei Wegwerf-Mailadressen eingerichtet und diese auf eine Site gesetzt, die ich bei Google angemeldet hab.
Die eine Mailadresse war klarer Text, die andere halt codiert. Beide Mailadressen bestanden aus zufälligen Buchstabenkombinationen, so daß sie nicht einfach durch "ausprobieren" angeschrieben werden konnten.
Nach einigen Tagen kamen die ersten Mails. Ich hab leider nicht direkt nachgeschaut und kann deshalb nicht sagen, wie lange das genau gedauert hat.
Nachdem ich das dann in etwa einen Monat laufen lassen hab, mußte ich feststellen, daß ich bei der unkodierten Mailadresse signifikant mehr Spam erhalten habe als bei der anderen. Das stand nachher in etwa 35 zu 200.
Das Ergebnis finde ich ein wenig überraschend, muß ich sagen. Der "Trick" ist ja nun wirklich nicht unbekannt. Wenn ich einen Adressen-Harvester programmieren würde, dann würde ich auch nach Unicodemaskierungen suchen. Das wäre ja im Prinzip nur ein regulärer Ausdruck mehr, den man schreiben müßte...
Ich weiß nicht mehr wer das noch war, aber irgendjemand wollte das ebenfalls testen. Wurde das gemacht? Würde mich interessieren, ob das gleiche Ergebnis rauskam.
Aber noch besser als Mailadressen so zu codieren finde ich die Methode, die wahsaga auf seiner Website einsetzt. Allerdings wird dazu eine serverseitige Sprache benötigt und die steht ja nicht jedem für jedes Projekt zur Verfügung...
Schöner Gruß,
rob
Moin!
Nachdem ich das dann in etwa einen Monat laufen lassen hab, mußte ich feststellen, daß ich bei der unkodierten Mailadresse signifikant mehr Spam erhalten habe als bei der anderen. Das stand nachher in etwa 35 zu 200.
Dein Ergebnis läßt sich natürlich auf zweierlei Weise interpretieren:
Die eine Sichtweise wird sagen, dass das Codieren den Spam signifikant verhindert.
Die andere Sichtweise wird sagen, dass das Codieren den Spam ja doch nicht sicher verhindert, sondern allenfalls reduziert.
Das Ergebnis finde ich ein wenig überraschend, muß ich sagen. Der "Trick" ist ja nun wirklich nicht unbekannt. Wenn ich einen Adressen-Harvester programmieren würde, dann würde ich auch nach Unicodemaskierungen suchen. Das wäre ja im Prinzip nur ein regulärer Ausdruck mehr, den man schreiben müßte...
Ich bin mir nicht sicher, welche Beweggründe dahinter stecken, Harvester auf die eine oder andere Weise zu programmieren.
Ich vermute nur einfach mal, dass die Gruppe der Adress-Harvester recht überschaubar ist, deshalb also kein riesiger Markt existiert, um entsprechende Software abzusetzen. Und solange ein Harvester ausreichend gut funktioniert, d.h. in genügenden Mengen pro Kilobyte Webadresse Mailadressen extrahiert - warum dann neue Software anschaffen oder ändern?
Mit anderen Worten: Die Codierung schützt dich nur dann, wenn sie nicht von zu vielen Anderen auch benutzt wird, weil es ab einem gewissen Verbreitungsgrad lohnend wird, die Harvester zu ergänzen.
Andererseits sind Spammer durchaus daran interessiert, allzu militante Spamhasser gerade eben nicht zu bespammen, denn die sorgen tatsächlich nur für Unruhe, beschweren sich bei den Providern, pflegen Blacklisten etc.
- Sven Rautenberg