Hallo Forum,
Dank Wikipedia konnte ich so langsam dahinter steigen, wie Bayes funktioniert. Sehe ich das richtig, dass der von dir beschriebene Filter folgendermaßen arbeitet: Zuerst wird der Kommentar in einzelne Worte zerhackt und anschließend mit Hilfe der (manuellen) Klassifizierung als Spam oder Ham einsortiert, wobei der Score aktualisiert wird. Später, wenn der Filter trainiert ist, liefert mir diese Zahl, summiert über alle Wörter in einem Kommentar, eine Wahrscheinlichkeit, ob der Kommentar Spam oder Ham ist.
Ganz genau richtig, wobei zu dieser Zahl noch
latex*(\ln(N_{Ham})-\ln(N_{Spam}))[/latex] addiert und das Ergebnis in [latex]e^{x}[/latex] eingesetzt wird, um die Wahrscheinlichkeit zu berechnen.
Wie man das genau implementiert ist mir allerdings noch ein wenig unklar.
Okay, ich werden den Artikel nochmal überarbeiten und die Implementierung besser erklären.
Gruß
Alexander Brock