Hallo seth,
Ich habe die Formeln ausgetauscht und die Formulierung deutlicher gemacht.
bzgl. der nachteile der konventionellen bayes-spam-filter habe ich eben noch zwei paper ergoogelt, die mit hilfe von HMMs arbeiten und auf den ersten blick recht vielversprechend aussahen:
Spam Deobfuscation using a Hidden Markov Model
Dynamically Weighted Hidden Markov Model for Spam Deobfuscation
Ich habe das Problem bei meinen E-Mails nicht, wahrscheinlich weil mein Filter mittlerweile alle Variationen von viagra etc. kennt.
Der Weblog-Spam ist im Moment noch viel zu primitiv für solche Spielereien, den erwischt völlig problemlos.
wenigstens die existenz solcher dinge sollten bei dir imho auch erwaehnt werden.
Richtig, ich bau das noch ein.
Gruß
Alexander Brock