Mailadressen absichern
Tobi
- html
0 xwolf
Hallo,
ich habe letztens gehoert, dass man Mailadressen auf Webseiten gegen robots absichern kann, die automatisch Webseiten nach Mailadressen durchsuchen fuer Spammailer, indem man die Zeichen im mailto mit ACII Code aufloest, also z.B. peter&64;gmx.de.
Stimmt das? Gruss,
Tobi
Hi,
ich arbeite gerade an einen Anti-SPAM-Programm, wozu auch ein Artikel gehoert, welcher deine Frage behandelt.
Dabei wird die Frage nachgegangen, wie SPAM-Spider vorgehen.
Dazu gehoert auch die Frage, ob sowas
xwolf@xwolf.de
sicher ist.
Welche Moeglichkeiten gibt es ueberhaupt, einen String danach zu pruefen ob es
eine valide E-Mailadresse ist?
1. Die Syntax.
In Perlnotation wuerde ein einfacher Check durch diesen
Ausdruck mit Regular Expression definiert werden:
if ($mail =~ /[1]+@[\w.-]+$/) { return 1; }
(Dieser Ausdruck ist natuerlich etwas vereinfacht. Wenn man die
Adresse voll gemaess der RFC testen will, waere die Regular Expression etwas
laenger. Ich empfehle hierzu ein Blick in das Modul CheckRFC.pm von
Andre Malo.
http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/selfforum/selfforum-cgi/shared/CheckRFC.pm?rev=1.11&content-type=text%2Fvnd.viewcvs-markup
)
Die meisten SPAM-Robots checken nur die Syntax eines Strings nach und nehmen
bei einem Match dann den Teil des Strings der als E-Mailadresse erkannt wurde
in die Adressliste auf.
Neuere SPAM-Robots beruecksichtigen bei der Pruefung des Strings auch andere Notationen,
wie zum Beispiel die Hexadezimalwerte der Ascii-Charsets.
So gilt und galt es als hilfreich, auf einer Webseite die E-Mailadresse wie folgt
im HTML-Source zu schreiben:
xwolf@xwolf.de
Vgl: http://www.zahoo.de/homepage.shtml
Diese Methode ist hilfreich gegen dumme Robots. Neuere Robots ersetzen alle Notationen
und Sonderzeichen und erkennen deswegen auch dies, bzw. die uebersetzte Variante
als gueltige E-Mailadresse.
In Perl ist die Uebersetzung von ASCII zu Hexadezimal eine Zeile.
Genauso wie aber auch die Rueckuebersetzung von Hexadezimal zu ASCII.
Wer in der Lage ist, ein Suchrobot zu schreiben, fuer den ist der Einbau von sowas
nun wirklich ein Klaks! Der einzige Grund, warum bekannte SPAMer-Robots es oft noch
nicht eingebaut haben, duerfte eher der sein, dass die Entwickler auch etwas
verdienen wollen...
Aehnlich verhaelt es sich mit dem umstrittenen 'Trick' alle E-Mailadressen nur
ueber den JavaScript-Befehl document.write auszugeben.
Beispiel
(aus http://www.akademie.de/websiteaufbau/tipps_tricks/administration/webmaster-tricks/mailto-maskerade.html):
<script language="JavaScript">
<!--
var name = "max";
var domain = "mustermann.de";
document.write('<a href=mailto:' + name + '@' + domain + '">');
document.write(name + @ + domain + '</a>');
-->
</script>
Genauso wie bei den vergeblichen Versuchen von Webworker-Newbies, ihren HTML-
Source zu verschluesseln, ist auf langer Sicht auch dies sinnlos: Alles was
ein Browser decodieren und anzeigen kann, kann auch ein Robot erkennen.
Robot-Programmierer sind nicht duemmer als Browser-Programmierer. Erst
recht nicht, wenn die Codes fuer die Browser OpenSource sind.
\w.- ↩︎