gudn tach!
Richtig, ich hatte blöderweise P(Ham) und P(W) vertauscht.
Jetzt kommen auch wieder die alten Formeln raus, nur der Rechenweg ist ein bischen anders.
ok, dann war bloss die bezeichnung P(Spam) irrefuehrend.
jetzt kann man's schon verstehen, aber es ist noch nicht ganz richtig.
"Zuletzt wird die Spam- mit der Ham-Wahrscheinlichkeit verglichen indem der Quotient gebildet wird. Man erhält einen vergleichswert V zwischen null und eins, den man als Spam-Wahrscheinlichkeit verwenden kann."
V ist aus dem intervall [0,\inf), nicht nur aus dem intervall [0,1].
bei V>1 ist die wahrscheinlichkeit groesser, dass es spam ist.
bei V<1 ist die wahrscheinlichkeit groesser, dass es ham ist.
V=1 macht einen nicht schlauer.
und noch zwei kleinigkeiten:
im satz "Jetzt wird für beide Kategorien die Umkehrung der bedingten Wahrscheinlichkeit berechnet:" wuerde ich noch einfuegen "mittels des bayestheorems".
und du koenntest noch mal irgendwo explizit anmerken, dass das von dir beschriebene modell eben einige sachen ausser acht laesst, z.b. wird per physiker-induktion ("es gilt fuer 1, es gilt fuer 2, also gilt's fuer alle.") von der kategorie-verteilung der _bisher_ eingegangenen e-mails auf die verteilung der _zukuenftig_ eingehenden geschlossen.
prost
seth