Hallo Freunde des gehobenen Forumsgenusses,
Ich bin mir nicht ganz sicher, aber ich meine bei der Analyse werden HTML tags herausgefiltert, unter anderem um diese Spaesschen zu erkennen:
<div>V</div><span>I</span><div>A</div><span>G</span><div>R</div><span>A</span>
Je nach dem, woran der Filter die Zeichenkette teilt (ich würde [^a-zA-Z0-9€$]+ nehmen)
sollte das auch kein größeres Problem darstellen.
Mal davon abgesehen duerfte ein <img> bei mir nicht notwendigerweise zu einer Spamklassifiziung fuehren, da ich auch mails mit <img> bekomme die nicht als Spam einzuordnen sind.
Die haben aber i.d.R. genug andere positive Wörter, so dass sie nicht in Spam eingeordnet werden.
Oder geht es um leere Mail mit einem Bild im Anhang?
Die sind dann aber auch Spam-typisch und somit leicht zu filtern.Noe. Habe mal eine rausgesucht, die sehen ungefaehr so aus (Ausschnitt aus dem Source Code):
[...]
Filename usw ist natuerlich jedes Mal anders.
Das ist ja genau das Spamtypische, eine (fast) leere Mail nur mit Bildern.
Gruß
Alexander Brock
Ceterum censeo Carthaginem esse delendam