Henryk Plötz: SPAM: emailadresse aus dem archiv entfernen?

Beitrag lesen

Moin,

Zwar filtere ich mittlerweile nach verschiedenen Kriterien bis zu 70% des Schrotts aus aber sowas muß leider gepflegt werden, insbesondere mit den rudimentären GMX Rules.

Ich hatte kürzlich ein paar Experimente mit verschiedenen Spamfiltern gemacht und kann den bogofilter[0] wärmstens empfehlen. Auf meinem Corpus von ~20.000 Nichtspams und ~4.000 Spams hat mir bogofilter -r nur 3 falsche Positive und 12 falsche Negative beschert. Das ist besser als das, was ifile[1] auf dem selben Testsatz machte (rund 40 falsche Positive und 400 falsche Negative) und vom Gefühl her deutlich besser als das was SpamAssassin[2] - den ich vorher benutzte - je geschafft hat.
Dann ist da noch CRM114[3] welches einen ziemlich coolen Algorithmus verwendet und bei anderen Leuten beeindruckende Leistungen zeigt[4]. Ich hatte aber keine Lust die rund 33h abzuwarten die es wohl gedauert hätte, meine 140 MB Mails einzulernen und kann daher keine qualifizierte Aussage dazu machen. Die Menge an falschen Negativen schien mir aber recht gut zu sein.

Ich setze jetzt also bogofilter ein und obwohl hier pro Tag rund 20 Spams aufschlagen, sehe ich nur etwa jeden zweiten Tag einen davon. Falsche Positive habe ich bis jetzt (das ist ca. einen Monat im Einsatz) nicht erlebt.
Das ist bedeutend besser als das Ergebnis von SpamAssassin, welches erhebliche Probleme mit deutschem Spam hatte, dafür aber auch eine ganze Menge normaler Mails auf der Basis von RBLs wegfilterte.

Für den verbleibenden Spam habe ich mir in meinem Mailprogramm eine Tastenkombination eingerichtet mit der ich den ganz einfach in bogofilter einlernen kann.

Dann möchte ich noch erwähnen, dass ich auch[5] glaube, dass man Spam mit primitiven Filtern auf Absenderbasis oder durch Anschreiben der Provider nicht wirkungsvoll beikommen kann. Stattdessen sollten wirklich alle Leute Filter einsetzen die den Spam an der Spammigkeit des Textes erkennen, denn den Text können die Spammer nicht so leicht ändern (und wenn, dann wäre es meistens kein Spam mehr).

[0] http://bogofilter.sourceforge.net/
[1] http://www.nongnu.org/ifile/
[2] http://spamassassin.org/
[3] http://crm114.sourceforge.net/
[4] http://www.paulgraham.com/wsy.html
[5] http://www.paulgraham.com/spam.html

--
Henryk Plötz
Grüße aus Berlin