Christoph Schnauß: intelligentes Gästebuch-Spam-Script?

Beitrag lesen

hallo Ashura,

Bitte? Also nimmt dein Script blindlings alle POST-Daten entgegen und schreibt sie direkt in die Datenablage?

Jaein - allerdings bin ich nicht absolut sicher, ob ich diese Nachfrage richtig verstehe. Selbstverständlich werden alle POST-Daten erstmal entgegengenommen. Sie werden allerdings dann mit ein paar RegExpressions gefiltert und erst danach in die Ablage geschrieben.

Habe ich z. B. folgendes XML-Dokument als Ablage, würde der Spambot das Datum mit deinem Script an die entsprechende Stelle (in das date-Element) schreiben?

<?xml version="1.0" standalone="yes"?>

<!DOCTYPE gb>
<gb>
  <entry>
    <name>Foo</name>
    <email>foo@example.org</email>
    <date>February 25, 2006</date>
    <comment>Hello World</comment>
  </entry>
</gb>

  
öhm ... mal abgesehen davon, daß ich derzeit kein XML in Benutzung habe - bei "name", "email" und "comment" wäre das tatsächlich so. Auch wenn die Formularfelder geringfügig anders heißen (und wenn ich damit ein Problem hätte, wüßte ich auch, wo ich eine Korrektur ansetzen müßte). Aber "date" gibts eben nicht als Formularfeld. Das gibt es nur als "interne" Variable des Scripts auf dem Server (und heißt auch ein bißchen anders) - und da kommt ja wohl ein bot nicht ran; dachte ich bisher zumindest.  
  
Du bringst mich allerdings auf die Idee, daß ich für die Datenhaltung doch mal XML probieren sollte. Hielt ich bisher nicht für zwingend erforderlich, da sich das "Datenaufkommen" in durchaus überschaubaren Grenzen hält.  
  

> Hier ist es im übrigen schon hilfreich, wenn man HTML-Links nicht zulässt  
  
Die sind zugelassen, jedenfalls in den Formularfeldern. Erlaubt ist beispielsweise bisher, daß jemand seine URL angibt und/oder seine mail-Adresse, und das erscheint dann auch als anklickbarer Verweis. Im Nachrichtentext selbst (textarea) wäre das nicht zugelassen, jedenfalls nicht anklickbar - HTML ist erlaubt.  
Das machen diese bots übrigens auch; sie schreiben mehrfach in ihre Texte, die fast immer mit "great site!..." anfangen, sowas wie <http://www.werbeadresse.com> hinein. Die spitzen Klammern sind zulässig, eine anklickbare URL wird das aber nicht. Aber es ist natürlich mehr als peinlich, wenn man eine URL zu irgendeiner "milf"-Adresse stehenläßt.  
  

> etwas anderes an Stelle des BB-üblichen [url][/url] verwendet  
  
BB-Code habe ich nicht drin.  
  

> > Das aktuelle Gästebuchscript kann ich natürlich noch bekanntgeben, wenn das benötigt wird.  
> Das würde ich in der Tat gerne einmal sehen wollen.  
  
Hm. Ich habe im Moment sogar zwei unterschiedliche Scripts laufen, die aber beide eaxakt dasselbe optische Ergebnis liefern: ein Perl-Script, und ein PHP-Script. Das Perl-Script ist zur Zeit nicht mehr verlinkt, aber wenns ein bot unter <http://www.christoph-schnauss.de/cgi-bin/gastb.pl> finden sollte, kann er das ebenfalls benutzen. Und ich nehme an, daß diese Spam-bots genau nach solchen URLs suchen und sie gezielt auszunutzen versuchen. Allerdings sehe ich natürlich an den logs, daß dieses Script (bisher) \_nicht\_ für Werbeeinträge benutzt wurde, sodern daß es ausschließlich <http://www.christoph-schnauss.de/kontakt/gastb.php> ist, auf das bisher zugegriffen wurde.  
Wahrscheinlich könnte ich mir Spam-Einträge noch wesentlich effektiver fernhalten, wenn ich meine Scripts nicht mit solchen Namen wie "gastb.xxx" versehen würde. Aber wie bereits ausgeführt, geht es mir im Moment nicht vorrangig um das "Fernhalten" von Spam, sondern um ein ganz spezifisches Verhalten der "Gästebuchspamer", das ich mir derzeit noch nicht erklären kann.  
  
  
Grüße aus Berlin  
  
Christoph S.

-- 
[Visitenkarte](http://community.de.selfhtml.org/visitenkarten/view.php?key=26)  
  
ss:| zu:) ls:& fo:) va:) sh:| rl:|