gudn tach!
Ich habe die Formeln ausgetauscht und die Formulierung deutlicher gemacht.
ok, der konsistenz halber wuerde ich (es wurde ja bereits angesprochen), die "i"s ersetzen, und zwar statt P(i|C) gleich P(w_i|C); das "i" danach wuerde ich durch "n" ersetzen. dann wuerde ich noch die AND-zeichen, die ja nicht jedem gelaeufig sind, durch kommas ersetzen; in der literatur werden afaik auch meist eher kommas oder mengen-schnitt-symbole bevorzugt, also
[latex]P(w_1,\dotsc,w_n|C)=P(w_1|C)\dotsm P(w_n|C)=\prod_{k=1}^n \frac{N_{C,k}}{N_C}.[/latex]
und im text danach wuerde ich die formulierung auch noch aendern:
"Lies: Die Wahrscheinlichkeit, dass ein Kommentar der Kategorie [latex]C[/latex] die Wörter [latex]w_2, w_2, \dotsc, w_n[/latex] enthält[KOMMA] ist gleich dem Produkt aller oben beschriebenen Einzelwahrscheinlichkeiten."
und weiter
"Diese Wahrscheinlichkeit berechnet man mit den Wörtern eines gerade eingetroffenen Kommentars sowohl für die Kategorie Ham, also erwünschte Kommentare[KOMMA] als auch für die Kategorie Spam."
soweit ok; aber den abschnitt
"Den Quotienten setzt man als P(B|A) in die Bayesformel ein und erhält die Formel für die Spam-Wahrscheinlichkeit des neuen Textes: [...]"
solltest du naeher erlaeutern.
prost
seth