Christian Kruse: Maßnahmen gegen Spammer

Beitrag lesen

你好 Christian,

mal eine Frage an den Mailexperten. Ich nutze zur Zeit Mozilla-Mail und
der Spam an Bildern über meine Selfadressen wächst stetig. Warum kann
er Mails wie die folgende nicht erkennen?

Mozilla Mail verwendet einen Bayes-Filter, der nach Wörtern sucht.

Das stimmt nicht. Er sucht nicht nach Wörtern, sondern er gewichtet Wörter.
Und aus der Gewichtung der Wörter folgt durch ein wenig Statistik-Magie
eine Klassifizierung des Textes (in Ham bzw. Spam).

Vermutlich werden HTML-Tags einfach weggeworfen, bevor der Bayes-Filter
drauf losgelassen wird. Deswegen sind so kleine Mails schlecht bis gar
nicht zu erkennen mit einem Bayes-Filter.

Kleine Mails sind deshalb schwer zu erkennen, weil die statistischen
Methoden, die zur Klassifizierung verwendet werden, besonders gut bei
großen Datenmengen funktionieren. Je mehr Daten, desto sicherer kann
klassifiziert werden, weil mehr Wörter vorliegen, die gewichtet werden
können. Je weniger Daten vorliegen, desto unsicherer ist die
Klassifizierung.

Die Urpsprungsidee war übrigens, die Mail völlig unverändert inkl. Header
und allem drum und dran durch den Filter laufen zu lassen, damit gerade
auch kurze HTML-Mails korrekt klassifiziert werden können. Ausserdem sind
Spam-Header sich häufig ähnlich (meist der gleiche X-Mailer-Header, etc,
pp.), wodurch die Gewichtung dieser Header-Felder bei ausreichend Training
sehr hoch ausfallen würde. Viele Mail-Clients machen das jedoch nicht,
meist aus rein technischen Gründen, manche haben auch (für mich abstruse)
Argumente für diese Verfahrensweise.

再见,
 克里斯蒂安

--
Wundert euch nicht, … | Noch eine Block-Installation: SELFHTML Aktuell
Wenn gewöhnliche Menschen Wissen erlangen, sind sie weise. Wenn Weise Einsicht erlangen, sind sie gewöhlnliche Menschen.
http://wwwtech.de/
0 72

Maßnahmen gegen Spammer

Fabienne
  • meinung
  1. -1
    Zeromancer
    1. 0
      Fabienne
      1. 0
        TomIRL
        1. 0
          Fabienne
          1. 0
            Armin
          2. 0
            Sven Rautenberg
            1. 0
              Fabienne
    2. 0
      Chris
      1. 0
        Zeromancer
        1. 0
          Chris
          1. 0
            Fabienne
  2. 0
    Stefano Albrecht
    1. 0
      TomIRL
  3. 0
    Mathias Bigge
    1. 0
      wahsaga
    2. 0
      Der Martin
      1. 0
        wahsaga
        1. 0
          Chris
          1. 0
            Der Martin
      2. 0
        Armin
        1. 0

          Vernünftiger Mail-Client?

          Chris
          • e-mail
          1. 0
            Der Martin
          2. 0
            Armin
            1. 0
              Ashura
            2. 0
              Der Martin
        2. 0
          Alexander Brock
          1. 0
            Armin
            1. 0
              Alexander Brock
              1. 0
                Mathias Bigge
                1. 0
                  Alexander Brock
                  1. 0
                    Mathias Bigge
                    1. 0
                      Alexander Brock
    3. 0
      Sven Rautenberg
      1. 0
        Mathias Bigge
        1. 0
          Christian Seiler
          1. 3
            Christian Kruse
            1. 0
              Christian Seiler
              1. 0
                Tim Tepaße
  4. 0
    Christoph Zurnieden
    1. 0

      Wie funktioniert SMTP?

      Chris
      • e-mail
      1. -1
        Vinzenz Mai
        1. 0
          Henryk Plötz
          1. 0
            Vinzenz Mai
      2. 2
        Sven Rautenberg
        1. 0
          Der Martin
        2. 0

          Wie RICHTIG Mails versenden?

          Chris
          1. 1
            Henryk Plötz
            1. 0
              Chris
              1. 0
                Der Martin
        3. 0
          Henryk Plötz
          1. 0
            Sven Rautenberg
            1. 0
              Christian Kruse
      3. 0
        Christoph Zurnieden
  5. 0
    Alexander Brock
    1. 0
      Sven Rautenberg
      1. 0
        Alexander Brock
  6. 0
    Andreas Lindig
    1. 0
      Alexander Brock
      1. 0
        at
        1. 0
          Alexander Brock
          1. 0
            at
            1. 0

              Formmailer

              Alexander Brock
      2. 0
        Andreas Lindig
        1. 0
          Andreas Lindig
        2. 0
          Alexander Brock
        3. 0
          Detlef G.
    2. 0
      Detlef G.
      1. 0
        Andreas Lindig
    3. 0
      Johannes Zeller
    4. 0
      Christian Seiler
  7. 0

    Software gegen Spammer

    Alexander Brock