Gerhard: Bad Words Blacklist für Gästebuch-Spammer

Hallo,

meint ihr es macht Sinn, für ein Gästebuch das ständig vollgespammt wird, Einträge deren Inhalt Wörter aus einer Blacklist enthält zu sperren?
Ich denke dabei zum Beispiel an: "viagra", "enlarge penis" und so weiter. Also Wörter die im deutschen Sprachgebrauch nicht so geläufig sind (speziell in meinem gästebuch, in dem der steirische dialekt öfter vorkommt als hochdeutsch).
Gibt es vielleicht schon irgendwo fertige Blacklists für diesen Zweck?

Mit freundlichen Grüßen
Gerhard

  1. Hi.

    Gibt es vielleicht schon irgendwo fertige Blacklists für diesen Zweck?

    Schau mal bei dmoz, vielleicht ist was dabei.

    vg Bud

  2. Hallihallo!

    Ich weiss nicht, ob Dir das hilft, aber ich fahre seit etwa einem Jahr mit folgendem Verfahren ganz gut:

    Es gibt 3 verschiedene Blacklists: Eine für das Absenderfeld, eine für verbotene Wörter im Homepage-Feld, und eine für verbotene Tags im Posting.

    Ein verbotenes Wort im Namensfeld (da standen bei mir des Öfteren Sachen wie "Buy Viagra" oder "http://buyviagra.com" drin), wird mit einem Punkt "bestraft".
    Die Bots, die bei mir wüteten, sind schon allein daran gescheitert, aber dazu weiter unten mehr.

    Weiters kann man bei mir seine Homepage angeben, die dann auch verlinkt wird. Sobald hier eins der Wörter "free", "buy", "order" oder "sex" vorkommt, wird dies mit zwei Punkten geahndet.

    Für den Nachrichtentext habe ich mich nicht für Wörter, sondern Tags als "verboten" entschieden. Nicht vorkommen dürfen hier "<a href", "[url]...[/url]" oder "[url=...]...[/url]". Zum Einbinden von Links habe ich eine Ersatzmöglichkeit geschaffen, die der hier verwendeten ähnlich ist.
    Ein verbotenes Tag im Nachrichtentext wird mit 3 Spampunkten bestraft.

    Erhält ein Posting nach dieser "Analyse" 3 oder mehr Spampunkte, bekommt der Besucher eine Zwangsvorschau serviert, mit dem Hinweis, daß da Etwas mit dem Posting nicht zu stimmen scheint. Er wird darüber aufgeklärt, WAS nicht stimmt, und bekommt die Möglichkeit, sein Posting so lange zu ändern, bis er auf unter 3 Punkte kommt (Affenformular).
    Jedes wegen Spamwahrscheinlichkeit abgelehnte Posting speichere ich in einer separaten Tabelle. Dadurch kann ich jederzeit nachvollziehen, wenn es mal zu Problemen kommen sollte.

    Ich komme durch dieses Verfahren mit einer Liste von insgesamt 12 Wörtern aus, und der Besucher kann im Prinzip trotzdem noch schreiben, was er will (solange er keine falsch formatierten Links setzt, was Bots jedoch _immer_ machten). Es gab bisher weder false positives, noch Spam in den Kommentaren. Dafür war nach etwa zwei Wochen meine "Müll"- Tabelle ziemlich voll...
    Sollte sich einer der "altbekannten" Bots wieder blicken lassen, wird er wieder scheitern, und auf "neue" Bots kann ich mich relativ leicht einstellen.

    Wovor man aber sicher nie wirklich sicher sein kann, sind menschliche Besucher mit Vandalismus- Absichten...

    Ich hoffe, das hilft Dir ein Wenig weiter.

    Viele liebe Grüße,
    Der Dicki