Alexander Brock: Artikel-Review: Bayesscher Spam-Filter für Weblogs

Beitrag lesen

Hallo Forum,

exp(x) waechst *trommelwirbel* exponentiell. ;-)

nee, echt?

  1. binde ein bignum-paket ein (laaaangsaaaam)

Das habe ich schon mitbekommen, ich habe das ganze mal mit bcmath auf 5000 Stellen hinter dem Komma rechnen lassen. Nachdem ich dann festgestellt hatte, dass das langsamer als alle SQL-Abfragen zusammen ist habe ich auf die Logarithmen-Formeln umgebaut.

wenn du exp weglaesst, macht das ja nix, dann rechnest du eben mit ln(V) und achte darauf, dass der ln nicht auf V angewendet wird, wenn V=0 ist.

Das kann nicht vorkommen, die ganze Software rechnet nur noch mit Summen von Logarithmen *g*

das wuerde bedeuten:

ln(V) ist aus dem intervall (-\infty,\infty), also ganz R.
bei ln(V)>0 ist die wahrscheinlichkeit groesser, dass es spam ist.
bei ln(V)<0 ist die wahrscheinlichkeit groesser, dass es ham ist.
ln(V)=0 macht einen nicht schlauer.

Genau, ich habe den Artikel dahingehend überarbeitet und die Software umgebaut.

eine ganz andere moeglichkeit waere, nicht den quotienten, sondern die differenz zu bilden, dann drueckt man sich zumindest vor grossen zahlen, da V somit nur im intervall [-1,1] liegen kann. ob das praktikabl ist, weiss ich allerdings aus dem stegreif nicht.

Das ergibt wieder diese hässlich kleinen Zahlen, die ich vermeiden wollte und für die man wieder bcmath bräuchte.

Gruß
Alexander Brock

0 56

Artikel-Review: Bayesscher Spam-Filter für Weblogs

Alexander Brock
  • programmiertechnik
  1. 0
    Felix Riesterer
    1. 0
      Mathias Brodala
      1. 0
        Alexander Brock
        1. 0
          Mathias Brodala
          1. 0
            Alexander Brock
  2. 1
    Robert Bienert
    1. 0
      Alexander Brock
      1. 1

        kleine anmerkung zum multiplikations-zeichen

        seth_not@home
        • sonstiges
        1. 0
          Alexander Brock
  3. 6
    Vinzenz Mai
    1. 1
      seth
      1. 0
        Alexander Brock
        1. 1
          seth_not@home
        2. 1
          Blaubart
          1. 1

            kleine anmerkung zur kommasetzung

            seth_not@home
            1. 1
              Auge
              1. 0
                seth
                • sonstiges
                1. 0
                  Auge
                  1. 0

                    ole, ole, metadiskussionen ueber komma-diskussionen

                    seth
                    1. 0

                      "ole, ole" ... die alten Schweden, die!

                      Auge
      2. 1
        Blaubart
        1. 1
          seth_not@home
          1. 1
            Blaubart
    2. 0
      Alexander Brock
      1. 3
        Vinzenz Mai
  4. 2
    seth
    1. 0
      Alexander Brock
      1. 1
        seth_not@home
        1. 0
          Alexander Brock
          1. 1
            seth
            1. 0
              Alexander Brock
              1. 1
                seth_not@home
                1. 0
                  Alexander Brock
                  1. 1
                    seth_not@home
                    1. 0
                      Alexander Brock
                      1. 0
                        seth_not@home
                        1. 0
                          Alexander Brock
                          1. 1
                            seth
                            1. 0
                              Alexander Brock
  5. 0
    Alexander Brock
    1. 1
      Robert Bienert
      1. 0
        Alexander Brock
        1. 1
          Robert Bienert
          1. 0
            Alexander Brock
            1. 1
              seth
              1. 0
                Alexander Brock
                1. 1
                  seth
                  1. 0
                    Alexander Brock
                  2. 0
                    O'Brien
    2. 1
      Der Dicki
      1. 0
        Alexander Brock
    3. 0
      Christian Seiler
      1. 0
        Alexander Brock
        1. 0
          Christian Seiler
          1. 0
            Alexander Brock