Kalle_B: Spam in Formularen ...

... ist mir noch nicht passiert.

Nun bin ich aber an einem größeren Projekt, wo so etwas in der heißen Phase denkbar ungelegen käme. Möchte mit einfachen Mitteln vorbeugen.

Was genau ist eigentlich das Problem mit Spam in Formularen?

Dass das verarbeitende Programm zugemüllt wird mit Massen und nicht mehr dagegen anarbeiten kann?

Oder dass der Müll ungeprüft in die Datenbank geschrieben wird?

Könnte ich für jedes Formular ein TAN-Nummer generieren, die sagen wir mal - eine Stunde gültig ist? Ich speichere die Nummer in der User- Tabelle, die ich ohnehin bei jedem Zugriff überprüfe.

Beim ersten Rückläufer ist diese TAN verbraucht, kommen noch tausend Formulare, kann das Script gleich zu Beginn abgebrochen werden.

Kalle

  1. Moin!

    Nun bin ich aber an einem größeren Projekt, wo so etwas in der heißen Phase denkbar ungelegen käme. Möchte mit einfachen Mitteln vorbeugen.

    Was genau ist eigentlich das Problem mit Spam in Formularen?

    Schade, dass du noch keinen Formularspam erhalten hast - dann würdest du das Muster der Spammer leichter erkennen können. Das wären Erfahrungswerte, auf denen aufbauend du Filter implementieren könntest.

    Dass das verarbeitende Programm zugemüllt wird mit Massen und nicht mehr dagegen anarbeiten kann?

    Das würde ich eher als Denial of Service bezeichnen. Spammer wollen sowas aber nicht erreichen.

    Oder dass der Müll ungeprüft in die Datenbank geschrieben wird?

    Ja, das ist einer der Aspekte.

    Es gibt im Prinzip zwei Arten von Formularspam:
    1. Formularspam, der schlechte Formmailer zum Spammen bringen soll.
    2. Formularspam, der aufgrund einer direkten Onlinestellung auf der Seite wirksam wird.

    Punkt 1: Entsprechende Prüfungen der Spammer merkt man immer dann, wenn der eigene Formmailer sehr seltsame Mails sendet. Such zum Beispiel in Google mal nach StarlaK8099@aol.com - dann siehst du, was ich meine.

    Punkt 2: Google-Ranking wird durch externe Verlinkung bestimmt. Jedes System, welches z.B. Kommentare erlaubt, und dabei eine verlinkte URL, die der Kommentierer frei definieren kann, erzeugt, und vom Betreiber nicht sorgfältig und regelmäßig überwacht wird (vergessene Gästebücher, Blogs, Foren, Kommentarsysteme), wird auf lange Sicht gesehen solchen Spam einfangen.

    Könnte ich für jedes Formular ein TAN-Nummer generieren, die sagen wir mal - eine Stunde gültig ist? Ich speichere die Nummer in der User- Tabelle, die ich ohnehin bei jedem Zugriff überprüfe.

    Wenn du eine User-Tabelle prüfen kannst, kann ja sowieso nur ein registrierter Benutzer das Formular wirksam absenden. Dann hast du ohnehin durch den Useraccount den besten Filter - kein Account = kein Kommentareintrag. Und fertig.

    Ansonsten klingt TAN-System ziemlich ähnlich wie "CAPTCHA" - einfach ein System, welches auf relativ niedrigem Niveau menschliche Intelligenz abprüft und so dumme Computerbotsysteme ausschließen soll.

    Beim ersten Rückläufer ist diese TAN verbraucht, kommen noch tausend Formulare, kann das Script gleich zu Beginn abgebrochen werden.

    Ich glaube nicht, dass das Problem des Formularspams die Massen sind - es ist eher der Inhalt.

    - Sven Rautenberg

    --
    My sssignature, my preciousssss!
    1. Moin moin,

      Punkt 1: Entsprechende Prüfungen der Spammer merkt man immer dann, wenn der eigene Formmailer sehr seltsame Mails sendet. Such zum Beispiel in Google mal nach StarlaK8099@aol.com - dann siehst du, was ich meine.

      der scheint nach jrubin wirklich wieder mal sehr aktiv zu sein. Bei mir hat er sich auf ein Feld in einem Suchformular eingeschossen, wobei es anscheinend zwei Eintragungen gibt. Mit dem wird es am meisten versucht:

      " dry Content-Type: multipart/alternative; boundary=627beddf50b17bd9f3c43d1de8f11b7b MIME-Version: 1.0 Subject: ilipino bcc: SusanMcD677@aol.com This is a multi-part message in MIME format. --627beddf50b17bd9f3c43d1de8f11b7b Content-Type: text/plain; charset="us-ascii" MIME-Version: 1.0 Content-Transfer-Encoding: 7bit s all that th wurrud prince wud imply, an it implies more to us thin to annywan else. tell ye, we re givin him th best we have in th shop. e re showin him that --627beddf50b17bd9f3c43d1de8f11b7b-- ."

      Oftmals gibt es auch den Eintrag:

      "some5265@wrb-web.de"

      (wrb-web.de ist klar, ist meine).

      Zum Glück hatte der bisher noch keinen Erfolg.

      Viele Grüße

      Jörg

      1. Hallo,

        das Thema interessiert mich. Hatte bisher nur einmal eine solche Attacke, und da wurden in alle Felder wilde eMail-Adressen eingetragen.

        Nun habe ich einige Inhaltsprüfung eingebaut. Also dass in diesem Feld nur Buchstaben stehen dürfen und in jenem nur Zahlen.

        Ich denke doch, das müsste helfen. Oder sind diese Robots intelligenter?

        Gruß
        Heinrich

        1. Hallo Heinrich,

          das Thema interessiert mich. Hatte bisher nur einmal eine solche Attacke, und da wurden in alle Felder wilde eMail-Adressen eingetragen.

          das könnte jrubin gewesen sein.

          Nun habe ich einige Inhaltsprüfung eingebaut. Also dass in diesem Feld nur Buchstaben stehen dürfen und in jenem nur Zahlen.

          So mache ich es auch, immer natürlich ensprechend der konkreten Umstände. Neuerdings baue ich auch immer eine kleine Rechenaufgabe ein, bei der das Ergebnis in ein Feld geschrieben werden muss.

          Ich denke doch, das müsste helfen. Oder sind diese Robots intelligenter?

          Das Thema ist momentan in vielen Foren aktuell. Sieh Dir einfach mal die Ergebnisse dieser Suche an: http://suche.de.selfhtml.org/cgi-bin/such.pl?suchausdruck=Formular+Spam&lang=on&feld=alle&index_1=on&index_2=on&index_4=on&index_5=on&index_6=on&hits=100.
          Da gibt es viele Tipps und Tricks.

          Viele Grüße

          Jörg