seth: Artikel-Review: Bayesscher Spam-Filter für Weblogs

Beitrag lesen

gudn tach!

a) Einleitung: Konzepte von Spamfiltern
   Du hast wunderbares Material zusammengetragen, hübsch gegliedert.
   Nutze dies => gliedere Deine Abschnitte mit entsprechenden Unterüberschriften

bei einem so kurzen text wuerde ich sub-unterschriften als fast den-lesefluss-stoerend empfinden. vielleicht die jeweiligen schlagworte kursiv setzen?

Verschiedene Konzepte
   - Captcha (-varianten)
   - Variation Feldnamen
   - Versteckte Felder

da zu jedem thema nur ein bis zwei saetze verloren werden, finde ich _eine_ ueberschrift besser.

Hauptabschnitt Bayesfilter
   - Konzept des Bayestheorem in einfachen Worten
     (Nein, nicht die Mathematik)

doch! fuer leute, die kein interesse haben, ein paar einfache erklaerungen; und fuer die interessierten wuerde ich einen abschnitt erstellen (keinen anhang bei einem so kurzen text!) und jenen einleiten, dass man ihn ueberspringen solle, wenn man von der mathematik dahinter nichts wissen will. auf die entsprechenden tiefergehenden wikipedia-artikel kannst du ja verlinken.

- Vorteile
   - Nebenaspekte

und nachteile!

b) Bayestheorem
   Nicht an zweiter Stelle, jedenfalls nicht in dieser Ausführlichkeit.
   Wenn so ausführlich, dann im Anhang, dann gern noch ausführlicher.

das bayes-theorem wird in genau einer zeile abgehandelt. kuerzer geht es kaum. fuer einen anhang ist es jedenfalls zu wenig. imho wuerde ein wikipedia-link aber genuegen. denn so kurz wie es momentan dasteht, versteht wohl kaum jemand, was die aussage des satzes ist, es sei denn er kannte sie schon vorher. in der wikipedia (oder evtl. bei wolfram oder so) ist dann wenigstens noch etwas hintergruendiges zu dem kram geschrieben. fuer "omas" _und_ mathematiker.

zu c) habe ich nix neues hinzuzufuegen. ein anhang waere halt imho fuer einen so kurzen text ungeeignet. dann besser die variante, die auch haeufig in anderen kurzen online-artikeln angewendet wird, naemlich warnen a la "achtung mathe! wer angst hat, einfach ueberspringen und da und da weiter lesen".

d) Beispielimplementierung

das schau ich mir ein ander' mal an. *gaehn*

noch ein paar formelle anmerkungen:

  • im abschnitt "bayestheorem" (den ich uebrigens anders nennen wuerde), fehlt ein =-zeichen

  • mathematische formeln werden normalerweise direkt in einen satz eingebettet und nicht mit doppelpunkten abgetrennt. die einrueckung ist natuerlich richtig und wichtig, aber der text sollte fluessiger sein, z.b.
    "Die Wahrscheinlichkeit, dass ein Kommentar eine Menge Wörter w enthält[komma!] lässt sich unter der naiven Annahme, dass das Auftreten eines bestimmten Wortes unabhängig von dem Auftreten aller anderen Wörter ist[komma!] durch
      [formel]
    ausdruecken."

  • kommasetzung insg. koennte besser sein.

  • der begriff "bedingte wahrscheinlichkeit" sollte fallen und verlinkt werden.

  • das i in der dritten formel hat mit dem ersten i nichts zu tun, was aber nicht jedem sofort klar wird.

  • bei grossen exponential-ausdruecken ist die schreibweise [latex]\exp(foooooo)[/latex] meist besser lesbar und deswegen der schreibweise [latex]e^{foooooo}[/latex] vorzuziehen.

  • geschweifte klammern als meta-runde klammern sind out. an der tafel moegen sie zwar u.u. sinnvoll sein, aber getext sind sie eher zu vermeiden, weil sie schon andere bedeutungen haben, allen voran "menge". ich empfehle \bigl( und \bigr). mehr dazu siehe wikipedia hilfe:teX

  • streng genommen gehoeren zwischen mathematischen umformungen noch die ausformulierten umformungsschritte. (aber ich gebe zu, dass bei den hiesigen schritten zusaetzlicher text nicht nur redundant, sondern sogar stoerend sein koennte, denn wer keine ahnung von / lust auf mathe hat, wird diese abschnitte eh ueberspringen.)

prost
seth

0 56

Artikel-Review: Bayesscher Spam-Filter für Weblogs

Alexander Brock
  • programmiertechnik
  1. 0
    Felix Riesterer
    1. 0
      Mathias Brodala
      1. 0
        Alexander Brock
        1. 0
          Mathias Brodala
          1. 0
            Alexander Brock
  2. 1
    Robert Bienert
    1. 0
      Alexander Brock
      1. 1

        kleine anmerkung zum multiplikations-zeichen

        seth_not@home
        • sonstiges
        1. 0
          Alexander Brock
  3. 6
    Vinzenz Mai
    1. 1
      seth
      1. 0
        Alexander Brock
        1. 1
          seth_not@home
        2. 1
          Blaubart
          1. 1

            kleine anmerkung zur kommasetzung

            seth_not@home
            1. 1
              Auge
              1. 0
                seth
                • sonstiges
                1. 0
                  Auge
                  1. 0

                    ole, ole, metadiskussionen ueber komma-diskussionen

                    seth
                    1. 0

                      "ole, ole" ... die alten Schweden, die!

                      Auge
      2. 1
        Blaubart
        1. 1
          seth_not@home
          1. 1
            Blaubart
    2. 0
      Alexander Brock
      1. 3
        Vinzenz Mai
  4. 2
    seth
    1. 0
      Alexander Brock
      1. 1
        seth_not@home
        1. 0
          Alexander Brock
          1. 1
            seth
            1. 0
              Alexander Brock
              1. 1
                seth_not@home
                1. 0
                  Alexander Brock
                  1. 1
                    seth_not@home
                    1. 0
                      Alexander Brock
                      1. 0
                        seth_not@home
                        1. 0
                          Alexander Brock
                          1. 1
                            seth
                            1. 0
                              Alexander Brock
  5. 0
    Alexander Brock
    1. 1
      Robert Bienert
      1. 0
        Alexander Brock
        1. 1
          Robert Bienert
          1. 0
            Alexander Brock
            1. 1
              seth
              1. 0
                Alexander Brock
                1. 1
                  seth
                  1. 0
                    Alexander Brock
                  2. 0
                    O'Brien
    2. 1
      Der Dicki
      1. 0
        Alexander Brock
    3. 0
      Christian Seiler
      1. 0
        Alexander Brock
        1. 0
          Christian Seiler
          1. 0
            Alexander Brock