seth_not@home: Artikel-Review: Bayesscher Spam-Filter für Weblogs

Beitrag lesen

gudn tach!

Ich habe die Formeln ausgetauscht und die Formulierung deutlicher gemacht.

ok, der konsistenz halber wuerde ich (es wurde ja bereits angesprochen), die "i"s ersetzen, und zwar statt P(i|C) gleich P(w_i|C); das "i" danach wuerde ich durch "n" ersetzen. dann wuerde ich noch die AND-zeichen, die ja nicht jedem gelaeufig sind, durch kommas ersetzen; in der literatur werden afaik auch meist eher kommas oder mengen-schnitt-symbole bevorzugt, also
[latex]P(w_1,\dotsc,w_n|C)=P(w_1|C)\dotsm P(w_n|C)=\prod_{k=1}^n \frac{N_{C,k}}{N_C}.[/latex]

und im text danach wuerde ich die formulierung auch noch aendern:
"Lies: Die Wahrscheinlichkeit, dass ein Kommentar der Kategorie [latex]C[/latex] die Wörter [latex]w_2, w_2, \dotsc, w_n[/latex] enthält[KOMMA] ist gleich dem Produkt aller oben beschriebenen Einzelwahrscheinlichkeiten."

und weiter

"Diese Wahrscheinlichkeit berechnet man mit den Wörtern eines gerade eingetroffenen Kommentars sowohl für die Kategorie Ham, also erwünschte Kommentare[KOMMA] als auch für die Kategorie Spam."

soweit ok; aber den abschnitt

"Den Quotienten setzt man als P(B|A) in die Bayesformel ein und erhält die Formel für die Spam-Wahrscheinlichkeit des neuen Textes: [...]"

solltest du naeher erlaeutern.

prost
seth

0 56

Artikel-Review: Bayesscher Spam-Filter für Weblogs

Alexander Brock
  • programmiertechnik
  1. 0
    Felix Riesterer
    1. 0
      Mathias Brodala
      1. 0
        Alexander Brock
        1. 0
          Mathias Brodala
          1. 0
            Alexander Brock
  2. 1
    Robert Bienert
    1. 0
      Alexander Brock
      1. 1

        kleine anmerkung zum multiplikations-zeichen

        seth_not@home
        • sonstiges
        1. 0
          Alexander Brock
  3. 6
    Vinzenz Mai
    1. 1
      seth
      1. 0
        Alexander Brock
        1. 1
          seth_not@home
        2. 1
          Blaubart
          1. 1

            kleine anmerkung zur kommasetzung

            seth_not@home
            1. 1
              Auge
              1. 0
                seth
                • sonstiges
                1. 0
                  Auge
                  1. 0

                    ole, ole, metadiskussionen ueber komma-diskussionen

                    seth
                    1. 0

                      "ole, ole" ... die alten Schweden, die!

                      Auge
      2. 1
        Blaubart
        1. 1
          seth_not@home
          1. 1
            Blaubart
    2. 0
      Alexander Brock
      1. 3
        Vinzenz Mai
  4. 2
    seth
    1. 0
      Alexander Brock
      1. 1
        seth_not@home
        1. 0
          Alexander Brock
          1. 1
            seth
            1. 0
              Alexander Brock
              1. 1
                seth_not@home
                1. 0
                  Alexander Brock
                  1. 1
                    seth_not@home
                    1. 0
                      Alexander Brock
                      1. 0
                        seth_not@home
                        1. 0
                          Alexander Brock
                          1. 1
                            seth
                            1. 0
                              Alexander Brock
  5. 0
    Alexander Brock
    1. 1
      Robert Bienert
      1. 0
        Alexander Brock
        1. 1
          Robert Bienert
          1. 0
            Alexander Brock
            1. 1
              seth
              1. 0
                Alexander Brock
                1. 1
                  seth
                  1. 0
                    Alexander Brock
                  2. 0
                    O'Brien
    2. 1
      Der Dicki
      1. 0
        Alexander Brock
    3. 0
      Christian Seiler
      1. 0
        Alexander Brock
        1. 0
          Christian Seiler
          1. 0
            Alexander Brock