Sven Rautenberg: Spam-Schutz

Beitrag lesen

Moin!

Das müsste doch möglich sein oder ? Und jeder User hat die Möglichkeit, Mails als Spam zu deklarieren. Die deklarierten werden dann in die neuste Spam-Definition aufgenommen.

Gibt es so etwas schon ? Meint Ihr, es hat eine Chance ?

Sowas gibts, es hat wirklich erfolgversprechende Trefferquoten (99,x Prozent richtig gefiltert), aber die Problematik sind die verbleibenden 0,x Prozent, die falsch gefiltert werden.

Der aktuell beste Ansatz ist wohl, die Wörter der Mail (und zwar alle, auch die im Header) mit einer statistischen Liste zu vergleichen, welche eine Wahrscheinlichkeitsangabe enthält, ob die Worte in Spam vorkommen oder in normaler Mail (die Liste entsteht aus vorhergehend empfangener Mail). Daraus kann man dann die Spam-Wahrscheinlichkeit einer Mail errechnen. Das Problem ist nur, dass der Benutzer diese Wahrscheinlichkeit irgendwie bestätigen muß. Er kriegt also die Post nur vorsortiert, muß dem System aber bestätigen, ob die Mails richtig einsortiert wurden. Er liest den Spam also dennoch. Andernfalls bestünde das Problem, dass möglicherweise die Post falsch einsortiert und wichtige Mail gelöscht wird.

Alle anderen Ansätze, Spam zu erkennen, sind demgegenüber relativ schlecht in der Erkennung. Eine reine Suche nur nach Signalwörtern ("Make Money Fast") ist dann zum Scheitern verurteilt, wenn die Spammer die Buchstaben variieren ("M4k3 M0n3y F4st") oder Schreibfehler absichtlich einbauen ("Make Monye Fast"). Und ein Filtern nach Absende-Server ist natürlich auch blöd. GMX hat z.B. anscheinend Hotmail gesperrt. Wer keine Kontakte @hotmail.com hat, für den ist das kein Verlust, wer aber welche hat - oder vielleicht haben könnte, den stört das mit Sicherheit.

- Sven Rautenberg

--
Signatur oder nicht Signatur - das ist hier die Frage!