Hi,
Ja; ich könnte automatisierte Mitteilungen auch von einem absolut sicheren Spam-Score abhängig machen.
Das glaube ich dir gern. So gern, dass ich das auf technischer Ebene gar nicht hinterfragen möchte, zumal ich da nicht hinreichend sattelfest bin, um ein ernstzunehmender Diskussionspartner zu sein.
ist aber eigentlich recht einfach: Ab einem Score von 3 wird ein Eintrag als Spam identifiziert. Dieser geringe Score wird nur über Inhaltsfilter erreicht. Üblich sind Scores über 200 (soviel bringt die Zeitmessung) oder 300 (je 100 bringen die versteckten Spam-Fallen).
In diesem Monat hatte ich z.B. nur 3 Spams von Telecom-IPs:
Score: 200
Feld "date" vor nur 13 Sekunden generiert: Score = 200
date: 26.06.2008 15:15:10
name:
email:
homepage:
auth0r: sdfsdf
subject: dsfdsf
text: fdsdfdsf
würde ich nicht melden - das war nur ein manueller Test.
Score: 508
Feld "date" vor nur 0 Sekunden generiert: Score = 200
Feld "name" ausgefüllt: Score = 100
Feld "email" ausgefüllt: Score = 100
Feld "homepage" ausgefüllt: Score = 100
Text beginnt mit "<a ": Score = 3
Text endet mit "</a>": Score = 3
Text enthält 4* "http://": Score = 2
date: 21.06.2008 01:04:01
name: Baigneefreefe
email: marakol88@metaping.com
homepage: http://blog-gps.com
auth0r: Baigneefreefe
subject: The Story of iRobot and the Roomba
text: <a href=http://bargains-hunter.blogspot.com>iRobot</a> is dedicated to creating realistic robotic solutions to real-world problems.
[viel Text in fünf Absätzen]
<a href=http://bargains-hunter.blogspot.com>This translates into a great benefit for customers: they're guaranteed cool robotic technology in every product the company makes.</a>
dagegen würde ich als eindeutig bezeichnen, genauso wie vielleicht auch:
Score: 504.1
Feld "date" vor nur 5 Sekunden generiert: Score = 200
Feld "name" ausgefüllt: Score = 100
Feld "email" ausgefüllt: Score = 100
Feld "homepage" ausgefüllt: Score = 100
2* Wordwrap: Score = 1.6
Text enthält 5* "http://": Score = 2.5
date: 19.06.2008 14:52:41
name: OpenSLAED
email: slaed_open@mail.ru
homepage: http://www.slaed.net
auth0r: OpenSLAED
subject: Open SLAED - The program for building site
text: Hi!
<img>http://www.slaed.net/uploads/files/files-xhvBPMQR4q-7885.png</img>
[einige viel Textabsätze mit diversen URL-Angaben]
Die Grenze würde ich dann so bei 504 oder 505 ansiedeln, was entweder durch Zeit + 3Spam-Fallen + mindestens mehrere Inhaltsfilter oder auch durch extrem viele Inhaltsfilter erreicht wird.
Der Spitzenreiter in diesem Jahr ist übrigens:
Score: 7075.8
Feld "date" vor nur 13 Sekunden generiert: Score = 200
Feld "name" ausgefüllt: Score = 100
Feld "email" ausgefüllt: Score = 100
3046* Wordwrap: Score = 2436.8
Text beginnt mit "<a ": Score = 3
Text endet mit "</a>": Score = 3
Text enthält 2* " adult ": Score = 4
Text enthält 73* " porn ": Score = 146
Text enthält 62* "porn</a>": Score = 124
Text enthält 80* " sex</a>": Score = 160
Text enthält 5* "online</a>": Score = 10
Text enthält 1* "health</a>": Score = 2
Text enthält 20* "free</a>": Score = 20
Text enthält 20* "hardcore": Score = 20
Text enthält 10* "fucking": Score = 10
Text enthält 2* "interracial": Score = 2
Text enthält 2839* "lesbian": Score = 2839
Text enthält 6* "pregnant": Score = 6
Text enthält 4* "stockings": Score = 4
Text enthält 1518* "http://": Score = 759
Text enthält 4* "credit card": Score = 2
Text enthält 8* "bdsm": Score = 4
Text enthält 25* "asian": Score = 12.5
Text enthält 45* " free ": Score = 22.5
Text enthält 3* " dating ": Score = 1.5
Text enthält 1* ">best ": Score = 0.5
Text enthält 168* ">free ": Score = 84
(den Mailtext spare ich mir besser... ;-)
Und in Hinsicht auf rechtliche Fragen, scheint mir der Fall dadurch eindeutiger denn je.
Ja. Dank Deiner gefundenen Seite, aus der ich dann wohl auch "Wenn Sie vermuten, dass der tatsächliche Absender von Spam-Mails T-Online Kunde ist, können Sie sich an die Adresse abuse@t-online.de wenden." zitieren werde - auch wenn es hier um Mail-Spam bei t-online-Kunden geht.
freundliche Grüße
Ingo