snorri: Kommentar-Spambot mit auffälligen Rechtschreibfehlern

Hi alle,

eines der von mir betreuten Projekte wird regelmäßig von einem ziemlich cleveren Spambot heimgesucht. Er kommt ca. einmal im Monat und füllt auf einigen, aber längst nicht allen Seiten ein Formular aus. Dabei trägt er kurze Texte ein, die als Kommentar unter einem Blog-Beitrag zunächst nicht besonders ins Auge fallen würden, z.B. so etwas:

"IMHO you've got the right aswner!"
"Wow, your post makes mine look felbee. More power to you!"
"BION I'm imrpsesed! Cool post!"
"Haha. I woke up down today. You've ceheerd me up!"
"I can aelrday tell that's gonna be super helpful."
"Leairnng a ton from these neat articles."
"Oh yeah, faublous stuff there you!"
"Posts like this brighten up my day. Thanks for tankig the time."
"Super jazezd about getting that know-how."
"Unpaarllleed accuracy, unequivocal clarity, and undeniable importance!"

Jede dieser Zeilen enthält einen charakteristischen Schreibfehler.

Was das soll? Ich vermute, da testet jemand möglichst unauffällig, welche Seiten keinen ausreichenden Spamschutz haben. Denn wenn man nach diesen Phrasen googelt, findet man stapelweise Treffer in diversen Blogs usw.. Der Urheber kann also Google als Hilfsmittel nutzen, um ungeschützte Blogs zu finden, und erhält sie sogar noch halbwegs sortiert nach Page Rank. Wie gesagt, ziemlich clever.

Nun würde ich ihn natürlich gerne aussperren. Naheliegende Lösung wäre, ihn an seinen Phrasen zu erkennen. Das müssen aber leider ziemlich viele sein, denn in den ca. 120 solchen Einträgen, die ich bisher empfangen habe, hat er sich nur selten wiederholt.

Deshalb meine Frage dazu: Das Ding ist ja bestimmt schon einschlägig bekannt und sicher hat auch schon jemand eine solche Datenbank mit diese Phrasen angelegt. Weiß von Euch jemand dazu einen nützlichen Link?

Danke schonmal,

-- snorri

  1. eines der von mir betreuten Projekte wird regelmäßig von einem ziemlich cleveren Spambot heimgesucht. Er kommt ca. einmal im Monat und füllt auf einigen, aber längst nicht allen Seiten ein Formular aus.

    Nun würde ich ihn natürlich gerne aussperren. Naheliegende Lösung wäre, ihn an seinen Phrasen zu erkennen.

    Dein Versuch in allen Ehren, aber sich auf einen einzelnen Spambot einzuschießen erscheint mir doch eher vergebene Liebesmüh'.

    Die einfachste Methode, sich aller automatischen Formularspammer zu entledigen, sind per CSS versteckte Formularfelder. Wer ein nicht sichtbares Feld ausfüllt, kann die Seite in aller Regel nicht im Webbrowser gesehen haben - jedenfalls in keinem auch nur halbwegs aktuellen. Ergo müsste es sich um einen Bot handeln. Fertig.

    Das müssen aber leider ziemlich viele sein, denn in den ca. 120 solchen
    Einträgen, die ich bisher empfangen habe, hat er sich nur selten wiederholt.

    Deshalb meine Frage dazu: Das Ding ist ja bestimmt schon einschlägig bekannt und sicher hat auch schon jemand eine solche Datenbank mit diese Phrasen angelegt.

    Wenn der Spammer so clever ist, wie dir erscheint, dann denkt er sich für jeden Monat einen neuen Satz aus. Oder er setzt sich mal eine halbe Stunde Stunde hin und hat einen Vorrat, den er auch noch an seine Kinder vererben kann.

    1. Hallo Wladimir,

      Die einfachste Methode, sich aller automatischen Formularspammer zu entledigen, sind per CSS versteckte Formularfelder.

      Alles schon ausprobiert, dafür ist das Ding zu schlau (und andere Bots übrigens auch). Auch viele der gängigen Captchas stören ihn offenbar nicht: Man findet seine Einträge auch unter Blogs mit Captchas in der Kommentarfunktion. Das einzige, was bisher geholfen hat, sind die ReCaptchas -- aber die sind auch für menschliche Besucher oft kaum lesbar.

      Wenn der Spammer so clever ist, wie dir erscheint, dann denkt er sich für jeden Monat einen neuen Satz aus.

      Keine Frage, eine solche Datenbank muss man aktuell halten. Aber so verbreitet wie dieses Ding anscheinend ist vermute ich stark, dass das bereits jemand macht. Man muss das Rad ja nicht neu erfinden :-)

      -- snorri

      1. Die einfachste Methode, sich aller automatischen Formularspammer zu entledigen, sind per CSS versteckte Formularfelder.

        Alles schon ausprobiert, dafür ist das Ding zu schlau (und andere Bots übrigens auch).

        Um so interessanter wäre es, seine Wirkungsweise genau zu untersuchen. Wenn er bei zwei <textarea>-Feldern immer jenes ausfüllt, welches gerade sichtbar ist, muss das ja einen Grund haben.

        Auch viele der gängigen Captchas stören ihn offenbar nicht: Man findet seine Einträge auch unter Blogs mit Captchas in der Kommentarfunktion.

        Dass Captchas nur echten Besuchern auf die Nerven gehen, aber kaum einen Bot stören, ist nun aber seit Jahren bekannt: http://caca.zoy.org/wiki/PWNtcha gehört meines Wissens nach zu den ersten Projekten, die sich mit dem automatisierten Auslesen befassten. Man beachte das kleine "Last modified 2 years ago" rechts oben oder den Verweis auf einen Vortrag, der bald zehnjähriges Jubiläum feiern darf.

      2. @@snorri:

        nuqneH

        Das einzige, was bisher geholfen hat, sind die ReCaptchas -- aber die sind auch für menschliche Besucher oft kaum lesbar.

        Und helfen auch nicht.

        Qapla'

        --
        Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
        (Mark Twain)
    2. Om nah hoo pez nyeetz, Wladimir!

      Die einfachste Methode, sich aller automatischen Formularspammer zu entledigen, sind per CSS versteckte Formularfelder.

      Auch Felder, die man abwählen muss, sind manchmal hilfreich.

      Matthias

      --
      1/z ist kein Blatt Papier.

      1. Hello,

        Die einfachste Methode, sich aller automatischen Formularspammer zu entledigen, sind per CSS versteckte Formularfelder.

        Auch Felder, die man abwählen muss, sind manchmal hilfreich.

        oder solche, in die man eine Wiederholung eintragen muss

        Bitte aber keine Captchas oder sonstige Dinge, die dem echten Benutzer ein schlechtes Gefühl bereiten. Die Wiederholung des Nickname, der Emailadresse oder Richtigstellung des Wohnwortes wird hingegen noch als positiv empfunden.

        Liebe Grüße aus dem schönen Oberharz

        Tom vom Berg

        --
         ☻_
        /▌
        / \ Nur selber lernen macht schlau
        http://bergpost.annerschbarrich.de
        1. Hiho!

          Die Wiederholung des Nickname, der Emailadresse oder Richtigstellung des Wohnwortes wird hingegen noch als positiv empfunden.

          So ein schoenes Wort: Wohnwort. Butterweich.

          --
          Signaturen sind blöd!
          1. Hello,

            Die Wiederholung des Nickname, der Emailadresse oder Richtigstellung des Wohnwortes wird hingegen noch als positiv empfunden.

            So ein schoenes Wort: Wohnwort. Butterweich.

            In welchen Wörtern liegt die Wärme einer Wohnung? Doch nur in Wohnworten :-)

            Danke für den philosphischen Ansatz. Kann ich wieder die ganze Woche Gedichte drüber verfassen :-)

            Liebe Grüße aus dem schönen Oberharz

            Tom vom Berg

            --
             ☻_
            /▌
            / \ Nur selber lernen macht schlau
            http://bergpost.annerschbarrich.de
            1. Danke für den philosphischen Ansatz. Kann ich wieder die ganze Woche Gedichte drüber verfassen :-)

              Wo können wir die nach Ablauf der Woche bwundern?

              Gruß
              Kalk

              1. Hello,

                Danke für den philosphischen Ansatz. Kann ich wieder die ganze Woche Gedichte drüber verfassen :-)

                Wo können wir die nach Ablauf der Woche bwundern?

                Schauwn wir mal, wie weit ich beim Gwdichten kwomme...

                Liebe Grüße aus dem schönen Oberharz

                Tom vom Berg

                --
                 ☻_
                /▌
                / \ Nur selber lernen macht schlau
                http://bergpost.annerschbarrich.de
                1. Schauwn wir mal, wie weit ich beim Gwdichten kwomme...

                  Vielleicht will die aber auch doch niemand sehen ;)

                  1. Hello,

                    Schauwn wir mal, wie weit ich beim Gwdichten kwomme...
                    Vielleicht will die aber auch doch niemand sehen ;)

                    Na, warten wir mal 100 Jahre :-D

                    Liebe Grüße aus dem schönen Oberharz

                    Tom vom Berg

                    --
                     ☻_
                    /▌
                    / \ Nur selber lernen macht schlau
                    http://bergpost.annerschbarrich.de
    3. Nun würde ich ihn natürlich gerne aussperren. Naheliegende Lösung wäre, ihn an seinen Phrasen zu erkennen.

      Askimet wäre ein Vorschlag. Die haben auch eine Bibliothek.

      Fred

    4. @@Wladimir:

      nuqneH

      Die einfachste Methode, sich aller automatischen Formularspammer zu entledigen, sind per CSS versteckte Formularfelder. Wer ein nicht sichtbares Feld ausfüllt, kann die Seite in aller Regel nicht im Webbrowser gesehen haben - jedenfalls in keinem auch nur halbwegs aktuellen. Ergo müsste es sich um einen Bot handeln.

      Nein. Es kann sich auch um einen Screenreader-Nutzer handeln.

      Qapla'

      --
      Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
      (Mark Twain)
  2. Hello,

    Nun würde ich ihn natürlich gerne aussperren. Naheliegende Lösung wäre, ihn an seinen Phrasen zu erkennen. Das müssen aber leider ziemlich viele sein, denn in den ca. 120 solchen Einträgen, die ich bisher empfangen habe, hat er sich nur selten wiederholt.

    Möchtest Du sie nun ausbremsen, oder anlocken und dokumentieren?
    Bei letzterem würde ich ja gerne mitmachen *Schalk im Nacken*

    Liebe Grüße aus dem schönen Oberharz

    Tom vom Berg

    --
     ☻_
    /▌
    / \ Nur selber lernen macht schlau
    http://bergpost.annerschbarrich.de