Artikel-Review: Bayesscher Spam-Filter für Weblogs von seth_not@home, 20.02.2007 19:31

Beitrag lesen

Artikel-Review: Bayesscher Spam-Filter für Weblogs

seth_not@home 20.02.2007 19:31

programmiertechnik

gudn tach!

Richtig, ich hatte blöderweise P(Ham) und P(W) vertauscht.
Jetzt kommen auch wieder die alten Formeln raus, nur der Rechenweg ist ein bischen anders.

ok, dann war bloss die bezeichnung P(Spam) irrefuehrend.

jetzt kann man's schon verstehen, aber es ist noch nicht ganz richtig.

"Zuletzt wird die Spam- mit der Ham-Wahrscheinlichkeit verglichen indem der Quotient gebildet wird. Man erhält einen vergleichswert V zwischen null und eins, den man als Spam-Wahrscheinlichkeit verwenden kann."

V ist aus dem intervall [0,\inf), nicht nur aus dem intervall [0,1].
bei V>1 ist die wahrscheinlichkeit groesser, dass es spam ist.
bei V<1 ist die wahrscheinlichkeit groesser, dass es ham ist.
V=1 macht einen nicht schlauer.

und noch zwei kleinigkeiten:
im satz "Jetzt wird für beide Kategorien die Umkehrung der bedingten Wahrscheinlichkeit berechnet:" wuerde ich noch einfuegen "mittels des bayestheorems".

und du koenntest noch mal irgendwo explizit anmerken, dass das von dir beschriebene modell eben einige sachen ausser acht laesst, z.b. wird per physiker-induktion ("es gilt fuer 1, es gilt fuer 2, also gilt's fuer alle.") von der kategorie-verteilung der _bisher_ eingegangenen e-mails auf die verteilung der _zukuenftig_ eingehenden geschlossen.

prost
seth

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

seth_not@home: Artikel-Review: Bayesscher Spam-Filter für Weblogs

Beitrag lesen

Artikel-Review: Bayesscher Spam-Filter für Weblogs

Artikel-Review: Bayesscher Spam-Filter für Weblogs

kleine anmerkung zum multiplikations-zeichen

kleine anmerkung zur kommasetzung

ole, ole, metadiskussionen ueber komma-diskussionen

"ole, ole" ... die alten Schweden, die!