adam: Kuriose Spam Mail

Hallo,

mein gmx Spam Filter ist im Moment mit folgenden Mails überfordert.

Ich bekomme Mails wie diese hier:
(Ausschnitt davon)

Hi

Es ist mein Vergnьgen, Sie zu einem Deal von US $ 25,3 Mio. (fьnfundzwanzig >Millionen,

Beim Wort "Vergnügen" befindet sich ein Sonderzeichen, ebenso bei fünfundzwanzig.

Der Spam Filter kann Mails nicht ausfiltern, wenn solche Sonderzeichen vorkommen. Ist das nur Zufall, oder werden solche Sonderzeichen in Mails integriert um Sie durch den Spam Filter durchzubekommen?

  1. Om nah hoo pez nyeetz, adam!

    Es ist mein Vergnьgen, Sie zu einem Deal von US $ 25,3 Mio. (fьnfundzwanzig >Millionen,

    Beim Wort "Vergnügen" befindet sich ein Sonderzeichen, ebenso bei fünfundzwanzig.

    Sag das mal den Russen ;-)

    Der Gunnar hat mal irgendwann einen Link gepostet, unter dem man sich anschauen kann, wie das Zeichen in UTF-8 heißt.

    Matthias

    --
    1/z ist kein Blatt Papier.

    1. Om nah hoo pez nyeetz, adam!

      Es ist mein Vergnьgen, Sie zu einem Deal von US $ 25,3 Mio. (fьnfundzwanzig >Millionen,

      Beim Wort "Vergnügen" befindet sich ein Sonderzeichen, ebenso bei fünfundzwanzig.

      Sag das mal den Russen ;-)

      Der Gunnar hat mal irgendwann einen Link gepostet, unter dem man sich anschauen kann, wie das Zeichen in UTF-8 heißt.

      Matthias

      Ich habe da gestern nochmal ein wenig gegoogelt. Offensichtlich funktioniert so ein Spam Filter einmal

      • mit Absenderadressen
      • und mit Schlüsselwörtern

      Vermutlich sind die einfach zu rafiniert für meinen 1&1 Spam Filter, obwohl ich mir sicher bin, das diese Mails (mit verschiedenen Texten aber immer mit falschen Zeichen), von mehreren aber immer den gleichen Domänen versendet werden.

      Die Links mit den ISO Geschichten finde ich sehr interessant, ich komme noch aus der Zeit, als man mit ASCII arbeitete und es dort zwei Leertasten gab, die zweite Leertaste war doch Alt+255.

      Gott ich werde wohl alt.

      1. Tach,

        Die Links mit den ISO Geschichten finde ich sehr interessant, ich komme noch aus der Zeit, als man mit ASCII arbeitete und es dort zwei Leertasten gab, die zweite Leertaste war doch Alt+255.

        kann nicht sein, ASCII (7-Bit) enthält das Non Breaking Space nicht, vermutlich meinst du eher Code page 437 (8-Bit). 437 ist übrigens nur 3 Jahre älter als die ISO-Kodierungen.

        mfg
        Woodfighter

    2. Der Gunnar hat mal irgendwann einen Link gepostet, unter dem man sich anschauen kann, wie das Zeichen in UTF-8 heißt.

      Es gibt keine UTF-8-Zeichen, weil UTF-8 keine Zeichenkodierung ist - es gibt höchstens Unicode-Zeichen - geeignete Werkzeuge sind Uniview oder decodeunicode.

  2. Der Spam Filter kann Mails nicht ausfiltern, wenn solche Sonderzeichen vorkommen. Ist das nur Zufall, oder werden solche Sonderzeichen in Mails integriert um Sie durch den Spam Filter durchzubekommen?

    Ich würde eher sagen, diese Mails kommen aus Russland und die Server können keine deutschen Umlaute.

    1. Moin Moin!

      Der Spam Filter kann Mails nicht ausfiltern, wenn solche Sonderzeichen vorkommen. Ist das nur Zufall, oder werden solche Sonderzeichen in Mails integriert um Sie durch den Spam Filter durchzubekommen?

      Ich würde eher sagen, diese Mails kommen aus Russland und die Server können keine deutschen Umlaute.

      Die Server schon (bzw. denen sind die nicht-ASCII-Zeichen völlig Banane). Das Problem dürfte sein, dass jemand (unbewußt) Encodings verdreht hat (ISO-8859-1 als ISO-8859-irgendwas gelesen), vielleicht sogar mehrfach. Irgendwann bleibt dann nur noch Müll statt der Umlaute übrig. Im Prinzip der selbe Effekt, der aus einem einzelnen Umlaut mit genügend unsachgemäßem Gefummel mit ISO-8859-1 und UTF-8 fast beliebig viele Sonderzeichen produziert. ("Hilfe, meine Umlaute sind kaputt.")

      Alexander

      --
      Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".