Kaufmanssladen: Können SPAM-Spider CSS?

Hallo Freunde des schönen Codes,

ich frage mich was ein SPAM-Abgraser aus sowas herauslesen würde:

<span style="display:none;">o</span>ott<span style="display:none;">o@</span>o@do<span style="display:none;">mai</span>mainnam<span style="display:none;">e.de</span>e.de

Ein SPAM-Sammler-Bot würde doch vermutlich

ootto@o@domaimainname.dee.de

grabschen

während ein CSS-fähiger browser dem Benutzer

otto@domainname.de anzeigt. Oder?

(ich habe es nur für dieses Bsp. direkt in das Tag gefummelt mit "style=", bitte keine Belehrungen dazu ;) )

  1. Moin!

    ich frage mich was ein SPAM-Abgraser aus sowas herauslesen würde:

    Ich mich auch.

    (ich habe es nur für dieses Bsp. direkt in das Tag gefummelt mit "style=", bitte keine Belehrungen dazu ;) )

    Das dürfte genau das Problem sein. Steht das "display:none" direkt im Tag drin, kann ein Spider das rausfiltern, ohne CSS wirklich verstehen zu müssen.

    Wird es allerdings durch Klassen oder IDs zugewiesen, muß der Spider nicht nur die jeweilige HTML-Datei spidern, sondern auch noch alles eingebundene CSS dazu. Und das HTML parsen, einen DOM-Baum aufbauen, das CSS parsen, dem DOM-Baum zuweisen, nach den Spezifitätsregeln die gültigen Anzeigeoptionen ermitteln und dann entscheiden, welche HTML-Elemente angezeigt werden, und welche nicht.

    Vielleicht implementieren neue Spider irgendwann einfach die Gecko-Engine, um genau das zu leisten, und greifen dann den Text der Webseite durch "Bildschirmfoto" oder Copy&Paste ab, um zu spidern. Kostet natürlich eine ganze Menge an Rechenzeit - aber wer tausende Bots zum Mailen verfügbar hat, hat auch genug verteilte Rechenleistung zum Spidern.

    Spannend in dieser Sache dürfte beispielsweise auch die umgekehrte Schriftrichtung sein. Man schreibt also moc.elpmaxe@otto und läßt diese Adresse richtigherum anzeigen, indem man "direction:rtl" angibt. Das Problem mit jeder Art von "quelltext-verschleierter Anzeige" ist aber: Die Adresse nur anzeigen reicht oft nicht aus, es soll am liebsten ein Link sein, den man klickt. Und dann scheitern wieder alle Versuche der Verschleierung.

    Und da man sowieso Spam kriegt, egal ob man die Mailadresse verschleiert oder nicht, ist die Investition in einen guten Spamfilter ohnehin zu tätigen. Ist sogar besser, man kriegt (zuerst) viel Spam aufgrund der veröffentlichten Mailadresse, dann kann man den Filter schneller besser trainieren. :)

    - Sven Rautenberg

    --
    My sssignature, my preciousssss!
    1. Hallo Sven,

      Spannend in dieser Sache dürfte beispielsweise auch die umgekehrte Schriftrichtung sein. Man schreibt also moc.elpmaxe@otto und läßt diese Adresse richtigherum anzeigen, indem man "direction:rtl" angibt.

      das ist 'ne nette Idee, aber ich habe es gerade mal ausprobiert: Weder IE6 noch Opera8.54 wenden direction:rtl auf einen Textknoten an (hab's mit einem span getestet). Macht der Firefox das? Schade eigentlich. ;-)

      Und da man sowieso Spam kriegt, egal ob man die Mailadresse verschleiert oder nicht, ist die Investition in einen guten Spamfilter ohnehin zu tätigen. Ist sogar besser, man kriegt (zuerst) viel Spam aufgrund der veröffentlichten Mailadresse, dann kann man den Filter schneller besser trainieren. :)

      Das hat was ...

      Schönen Tag noch,
       Martin

      --
      F: Was ist ekliger als ein angebissener Apfel mit einem Wurm drin?
      A: Ein angebissener Apfel mit einem halben Wurm.
    2. Und da man sowieso Spam kriegt

      Ich bekomme keinen, bisher. Jedenfalls nicht auf den "wichtigen" eMailadressen meiner Domain. Nur auf den unwichtigen Freemailer-eMailadessen.

      :)

      1. Hi!
        ich bekomm nicht mal Spam, obwohl ich "nur" eine kostenloses Web.de Adresse habe.
        ciao, hubschraubaer

        1. Hi!

          ich bekomm nicht mal Spam, obwohl ich "nur" eine kostenloses Web.de Adresse

          Seit wann bekommt man mit einer Freemail-Adresse mehr Spam als mit einer mit seiner eigenen Domain?
          So ein Zusammenhang ist mir persönlich nicht bekannt - und wenn es euch beruhigt: Ich bekomme 15-25 Spammails pro Tag alleine über die Adressen mit meinen Domains (also z.B. mail@tobias-unger.de)!

          Grüße aus Nürnberg,
          Tobias

  2. hi,

    Ein SPAM-Sammler-Bot würde doch vermutlich
    ootto@o@domaimainname.dee.de
    grabschen
    während ein CSS-fähiger browser dem Benutzer
    otto@domainname.de anzeigt. Oder?

    Nicht jeder Benutzer eines nicht-CSS-fähigen Clients ist ein Spambot - von daher fällt diese Möglichkeit also eigentlich schon aus.

    gruß,
    wahsaga

    --
    /voodoo.css:
    #GeorgeWBush { position:absolute; bottom:-6ft; }
  3. Hallo

    Ein SPAM-Sammler-Bot würde doch vermutlich

    ootto@o@domaimainname.dee.de

    grabschen

    während ein CSS-fähiger browser dem Benutzer

    otto@domainname.de anzeigt. Oder?

    Und was macht der, der keinen oder einen nur ungenügend CSS-fähigen Browser hat?

    Tschö, Auge

    --
    Die Musik drückt aus, was nicht gesagt werden kann und worüber es unmöglich ist zu schweigen.
    (Victor Hugo)
    Veranstaltungsdatenbank Vdb 0.1