Phil: Wie gehen Spam-Bots vor?

Hi!
Eine Frage: Wie gehen Spam-Bots vor, auf der suche nach neuen Mailaddys?

Durchsuchen die den Quelltext oder durchsuchen die nur das für den User Sichtbare?
Somit wären ja z.B. inputs mit type="hidden" geschützt, oder?
CU
http://www.yubb.de

  1. Hi,

    Eine Frage: Wie gehen Spam-Bots vor, auf der suche nach neuen Mailaddys?

    immer raffinierter. Wobei die meisten Spam-Bots es eher auf Mailaddressen abgesehen haben, nicht auf Mailaddys.

    Durchsuchen die den Quelltext oder durchsuchen die nur das für den User Sichtbare?

    Ein Bot weiß zunächst einmal mit dem Begriff "sichtbar" nichts anzufangen. Genau wie der Browser hat er nur eine Aneinanderreihung von Zeichen vor sich, die unsereins als Quellcode bezeichnet, und untersucht diese dann auf Dinge, die nach Mailadressen aussehen.

    Somit wären ja z.B. inputs mit type="hidden" geschützt, oder?

    Geschützt ist nicht mal eine Adresse, die Du als Grafik abgelegt hast. Zwar denke ich nicht, dass bereits viele dieser Programme auf dem Markt sind; aber prinzipiell ist es kein Problem, eine Texterkennung einzusetzen.

    Das was Du suchst, nämlich ein Schutz davor, dass irgendein Programm nicht erkennt, was ein User erkennen kann, existiert nicht. Ein einziger Bot muss raffiniert genug sein, um die Adresse trotzdem herauszufiltern - und schon ist sie im Umlauf.

    Cheatah

    1. Moin Cheatah,

      immer raffinierter. Wobei die meisten Spam-Bots es eher auf Mailaddressen abgesehen haben, nicht auf Mailaddys.

      Ich weiß Deine Beiträge durchaus zu schätzen, aber das war doch ein bißchen pinglig oder?

      Addy ist durchaus geläufig für Addresse

      regds
      Wiz

      1. Hi,

        Addy ist durchaus geläufig für Addresse

        Hm, dachte immer, das wäre eher Adilette...

        SCNR,

        Utz

        1. Moin,

          Hm, dachte immer, das wäre eher Adilette...

          Fast richtig. Es fehlt nur die Top Level Domain

          www.Adilette...de

          *LOL*

          regds
          Wiz

          1. Hi,

            Es fehlt nur die Top Level Domain
            www.Adilette...de

            das ist eine Second Level Domain, eine Top Level Domain wäre .adilette

            </archiv/2002/5/12610/#m69912>

            LG Orlando,
            kleinlich

      2. Hi,

        das war doch ein bißchen pinglig oder?

        ich bin der Ansicht, solche k3wle sCr|pT-k1dD!3-Sprache funzt net. Daher bevorzuge ich es, wenn man im Wesentlichen deutsch oder eine andere Hochsprache mit mir redet.

        Addy ist durchaus geläufig für Addresse

        Drum bin ich ja auch auf die Idee gekommen, was gemeint sein könnte.

        Cheatah

    2. Moin,

      Geschützt ist nicht mal eine Adresse, die Du als Grafik abgelegt hast. Zwar denke ich nicht, dass bereits viele dieser Programme auf dem Markt sind; aber prinzipiell ist es kein Problem, eine Texterkennung einzusetzen.

      Naja, aber in der Realität hat OCR selbst da Probleme wo man versucht möglichst gute Scans zu kriegen. Wenn man es aber gemeinerweise darauf abgesehen hat, die OCR absichtlich zu verwirren (lustige Farben, schlimme Schriftarten, zusätzliches Rauschen) wird das ein wahres Trauerspiel (für die OCR).

      Das was Du suchst, nämlich ein Schutz davor, dass irgendein Programm nicht erkennt, was ein User erkennen kann, existiert nicht.

      Au contraire: Als ich das letzte mal nach künstlicher Intelligenz geschaut habe, war der Stand, dass sie praktisch nicht existiert. Du wirst also immer etwas finden, was ein normaldenkender Mensch spielend hinkriegt, ein x-beliebiges Programm aber vor größere Probleme stellt. Das kann man schon recht einfach erreichen, indem man eine textuelle Beschreibung der email-Addresse gibt, oder eine Art Spiel mit der man sie erraten soll. Das kann unter Umständen sogar als lustiger Zeitvertreib die Webseite aufwerten :-)

      --
      Henryk Plötz
      Grüße aus Berlin

      1. Hi,

        Naja, aber in der Realität hat OCR selbst da Probleme [...]

        ja, das ist richtig. Dennoch ist dieses Szenario keineswegs undenkbar.

        Das was Du suchst, nämlich ein Schutz davor, dass irgendein Programm nicht erkennt, was ein User erkennen kann, existiert nicht.
        Au contraire: Als ich das letzte mal nach künstlicher Intelligenz geschaut habe, war der Stand, dass sie praktisch nicht existiert.

        Im Gegensatz zu natürlicher Dummheit. SCNR ;-)

        Du wirst also immer etwas finden, was ein normaldenkender Mensch spielend hinkriegt, ein x-beliebiges Programm aber vor größere Probleme stellt.

        Du vergisst hierbei, dass es um Informationen geht, die im Normalfall noch von einem zweiten Programm zu interpretieren ist: vom Browser. Es ist schwer etwas hinzubekommen, das Programm A vom Typ "lieb[tm]" erkennt, Programm B vom Typ "böse[tm]" jedoch nicht.

        Das kann man schon recht einfach erreichen, indem man eine textuelle Beschreibung der email-Addresse gibt,

        Wenn _nur_ der Mensch die Adresse lesen soll, stimme ich Dir zu. Gewöhnlich dient sie aber zur Verwendung in einem Mailprogramm, und dazu ist eine Umschreibung nicht wirklich sinnvoll :-)

        oder eine Art Spiel mit der man sie erraten soll. Das kann unter Umständen sogar als lustiger Zeitvertreib die Webseite aufwerten :-)

        Hm, so habe ich das noch gar nicht gesehen :-)

        Cheatah

        1. Moin,

          Wenn _nur_ der Mensch die Adresse lesen soll, stimme ich Dir zu.

          Naja, damit kann ich ja auch nicht rechnen, dass die hier jemand automatisch in sein Mailprogramm eingefügt haben will. Natürlich ist das Unmöglich es so herzurichten, dass ein (hinreichend fortgeschrittener) Spambot sie nicht kriegt, ein normales Mailprogramm aber schon. Auf die Idee das zu versuchen, bin ich gar nicht gekommen.

          --
          Henryk Plötz
          Grüße aus Berlin

    3. Eine interessante Möglichkeit: Eine Mail einrichten, die man pauschal überall angibt. Diese Mail besitzt aber nur einen Autoresponder, der die richtige Mailadresse verschickt.
      Und dann hat man die Mailaddy. Ein Bot kann damit nix anfangen, der menschliche Nutzer schon...

      1. Hi,

        Eine interessante Möglichkeit: Eine Mail einrichten, die man pauschal überall angibt. Diese Mail besitzt aber nur einen Autoresponder, der die richtige Mailadresse verschickt.

        hm, als Idee gar nicht schlecht! Der Nachteil dabei ist, dass es nicht wirklich benutzerfreundlich ist; und natürlich dass auf diese Weise leider Bounces erzeugt werden, weil die meisten From-Angaben in Spam-Mails falsch sind.

        Aber in jedem Fall überlegenswert.

        Cheatah

      2. Tach auch,

        Eine interessante Möglichkeit: Eine Mail einrichten, die man pauschal überall angibt. Diese Mail besitzt aber nur einen Autoresponder, der die richtige Mailadresse verschickt.

        Nehmen wir mal den extrem unwahrscheinlichen Fall an der Spammer versendet sein Zeug unter seiner richtigen Adresse (ja, ja, ich weiss, mehr als unwahrscheinlich. Aber man wird doch noch traeumen duerfen), dann schickst Du ihm gleich Deine richtige Adresse. Sehr freundlich von Dir.

        Und dann hat man die Mailaddy. Ein Bot kann damit nix anfangen, der menschliche Nutzer schon...

        Und eventuell das Programm dass bounces und aehnliches auswertet...

        Gruss,
        Armin

        1. Hi,

          [...] dann schickst Du ihm gleich Deine richtige Adresse.

          ...die er unter normalen Umständen sofort hätte. Jetzt muss er sie erst mal auswerten. Wenn man dann noch sämtliche Hinweise auf die angemailte Adresse streicht... ;-)

          Und dann hat man die Mailaddy. Ein Bot kann damit nix anfangen, der menschliche Nutzer schon...
          Und eventuell das Programm dass bounces und aehnliches auswertet...

          Zwar ist natürlich auch das denkbar, aber meines erachtens mindestens so unwahrscheinlich wie eine OCR-Erkennung in Grafiken ;-)

          Meines Erachtens wird bei dieser Idee das Spam-Risiko auf ein Minimum reduziert. Natürlich ist es nicht perfekt; natürlich kann noch immer jeder die richtige Adresse weitergeben, wenn er sie erst mal erfahren hat; natürlich ist das kein 100%iger Schutz. Einen solchen erreicht man nach wie vor nur, indem man keine Mailadresse besitzt.

          Cheatah

          1. hallo Hajo,

            natürlich ist das kein 100%iger Schutz. Einen solchen erreicht man nach wie vor nur, indem man keine Mailadresse besitzt.

            was bekanntlich dazuführen kann, dass man statt putzmann bei microsoft, millionär wird ;-)

            grüße
            thomas

            1. Hi,

              natürlich ist das kein 100%iger Schutz. Einen solchen erreicht man nach wie vor nur, indem man keine Mailadresse besitzt.
              was bekanntlich dazuführen kann, dass man statt putzmann bei microsoft, millionär wird ;-)

              *g* stimmt, da gab's mal 'ne Geschichte... :-)

              Cheatah

  2. Eine Frage: Wie gehen Spam-Bots vor, auf der suche nach neuen Mailaddys?

    Durchsuchen die den Quelltext oder durchsuchen die nur das für den User Sichtbare?
    Somit wären ja z.B. inputs mit type="hidden" geschützt, oder?

    Es ist putzig zu sehen, daß Du entweder meinst, schlauer als jemand zu sein, der mit Adressuche sein Geld verdient oder aber nicht bemerkst, daß Du eine mögliche Adressquelle entdeckt hast :)

    Vielleicht interessiert Dich auch diese Seite: http://www.leekillough.com/antispam.html.

    Gruß,
      soenk.e

    1. Hi Sönke,

      Vielleicht interessiert Dich auch diese Seite:
      http://www.leekillough.com/antispam.html.

      also wenn so ein Spam-Robot es noch nicht mal schafft, einen echten
      UserAgent-String zu schicken und sich an die robots-Konventionen zu
      halten, um nicht aufzufallen, dann ist das irgendwie eine schwache
      Leistung ...

      Viele Grüße
            Michael

  3. Moin

    Durchsuchen die den Quelltext oder durchsuchen die nur das für den User Sichtbare?

    Ich habe irgendwo mal gesehen ( sorry Alzheimer, weiß nicht mehr wo )
    das die E-Mail Addy im Quelltext maskiert werden kann, so daß sie für die bots nicht mehr erkennbar ist. Maybe haben sich die Bots bereits darauf eingestellt.

    *Unglaubliche Demut* Habe ich diese Maskierung sogar in SelfHtm gesehen?

    K.A.

    regds
    Wiz

    1. Tach auch,

      Ich habe irgendwo mal gesehen ( sorry Alzheimer, weiß nicht mehr wo )
      das die E-Mail Addy im Quelltext maskiert werden kann, so daß sie für die bots nicht mehr erkennbar ist.

      So in der Art?
      <a href="mailto:s&#112;&#97;m&#64;&#103;r&#101;&#119;&#101;&#46;&#99;&#111;&#46;uk">&#115;&#112;&#97;&#109;&#64;&#103;&#114;e&#119;e&#46;&#99;o.&#117;k</a>

      Das stand wahrscheinlich in allen moeglichen Artikeln, Weblogs

      Maybe haben sich die Bots bereits darauf eingestellt.

      Nicht nur may be, sondern almost certainly. Jeder halbwegs vernuenftige Email Harvester duerfte in der Lage sein so etwas zu verarbeiten.

      *Unglaubliche Demut* Habe ich diese Maskierung sogar in SelfHtm gesehen?

      Mit ziemlicher Sicherheit. Und hier im Forum ist das auch schon diskutiert worden, allerdings bin ich zu faul das jetzt rauszusuchen.

      Gruss,
      Armin

      1. Moin,

        So in der Art?
        <a href="mailto:s&#112;&#97;m&#64;&#103;r&#101;&#119;&#101;&#46;&#99;&#111;&#46;uk">&#115;&#112;&#97;&#109;&#64;&#103;&#114;e&#119;e&#46;&#99;o.&#117;k</a>

        Nicht ganz so! Du verwendest UNI Code! Was ich geshen habe war einfacher.

        Es ging mit irgendwelchen ESCAPE Sequencen:
        Also mal ganz profan so: *meineaddy.@web.schlachmichtot*!

        LOL

        Ungefähr so.

        Leider müßig da ich es wirklich nicht mehr weiß ( Auf die Husche )
        Wenn ich Zeit habe finde ich es raus.

        regds
        Wiz

        1. Hi,

          Nicht ganz so! Du verwendest UNI Code! Was ich geshen habe war einfacher.

          vom Prinzip her war es sicher das gleiche - denn es muss irgendwas sein, was der Browser erkennen kann.

          Und was der Browser kann, schafft ein Spam-Bot schon lange...

          Wenn ich Zeit habe finde ich es raus.

          Ja, das wäre nett! :-)

          Cheatah

          1. Moin,

            Nicht ganz so! Du verwendest UNI Code! Was ich geshen habe

            war »» »» Wenn ich Zeit habe finde ich es raus.

            Ja, das wäre nett! :-)

            Leider ist meine Zeit so was von knapp ( habe Zwillinge an der Backe )

            Ich bin mir fast sicher das ich es dort gesehen habe:

            http://www.ideenreich.com/

            Sorry, mehr kann ich nicht bei steuern :-(

            regds
            Wiz

            1. Hi,

              Ich bin mir fast sicher das ich es dort gesehen habe:
              http://www.ideenreich.com/

              ah, das erklärt vieles. Unter ideenreich.com findet man eine Vielzahl von Ideen, die auf den ersten Blick gut aussehen und unter Laborbedingungen auch funktionieren, aber in der Praxis versagen, weil wichtige Fakten einfach unter den Tisch fallen. Mir fällt bei dieser Site immer der Name Matt Wright ein... :-)

              Cheatah

              1. Moin!

                Ich bin mir fast sicher das ich es dort gesehen habe:
                http://www.ideenreich.com/

                ah, das erklärt vieles. Unter ideenreich.com findet man eine Vielzahl von Ideen, die auf den ersten Blick gut aussehen und unter Laborbedingungen auch funktionieren, aber in der Praxis versagen, weil wichtige Fakten einfach unter den Tisch fallen. Mir fällt bei dieser Site immer der Name Matt Wright ein... :-)

                ROTFL! Obwohl, wenn ich mir das so betrachte, faellt mir da sofort der Teil mit dem "die auf den ersten Blick gut aussehen" auf - Gibt es sowas auf der Seite wirklich? Ich meine, Ideenreich.com ist ja gut gemeint, aber die Auswirkungen auf die Fragen beispielsweise hier im Forum und die deutsche Webentwicklung im allgemeinen wären doch imho wert, in einer Diplomarbeit untersucht zu werden. Bei Matt Wright herrscht ja schon Einigkeit hierueber ;)

                Btw, ist es Zufall, dass ich gerade an das 7-jährige Jubiläum der Merkbefreiung denke? ;)

                Viele Gruesse,

                Einbecker

                1. Hi,

                  ROTFL! Obwohl, wenn ich mir das so betrachte, faellt mir da sofort der Teil mit dem "die auf den ersten Blick gut aussehen" auf - Gibt es sowas auf der Seite wirklich?

                  Dein und mein Blick sind vermutlich etwas geschärfter als der des durchschnittlichen Ideenreich-Besuchers... ;-)

                  Btw, ist es Zufall, dass ich gerade an das 7-jährige Jubiläum der Merkbefreiung denke? ;)

                  Oh, das habe ich gar nicht mitbekommen! Hast Du dazu 'ne URL?

                  Cheatah

                  1. Moin!

                    Dein und mein Blick sind vermutlich etwas geschärfter als der des durchschnittlichen Ideenreich-Besuchers... ;-)

                    Tja, was Kontaktlinsen so ausmachen koennen ;-)

                    Btw, ist es Zufall, dass ich gerade an das 7-jährige Jubiläum der Merkbefreiung denke? ;)

                    Aber latuernich: http://www.heise.de/tp/deutsch/inhalt/co/13155/1.html.

                    Viele Gruesse,

                    Ein*einhalbStundenarbeitunddannerstmaleinenMonatUrlaub*becker

                    1. http://www.moin.com/

                      Btw, ist es Zufall, dass ich gerade an das 7-jährige Jubiläum der Merkbefreiung denke? ;)

                      Aber latuernich: http://www.heise.de/tp/deutsch/inhalt/co/13155/1.html.

                      http://www.learn.to/quote

                      Ein*einhalbStundenarbeitunddannerstmaleinenMonatUrlaub*becker

                      http://www.genau.de/ http://www.daran.org/ http://www.lags.tv/ http://www.wohl.de/ ;)

                    2. Hi,

                      http://www.heise.de/tp/deutsch/inhalt/co/13155/1.html.

                      wunderbar, danke! :-)

                      Cheatah

        2. Tach auch,

          Es ging mit irgendwelchen ESCAPE Sequencen:
          Also mal ganz profan so: *meineaddy.@web.schlachmichtot*!

          Was aber auch nicht so furchtbar viel aendern duerfte. Aus dem einfachen Grunde dass die Leute die die Email Harvester programmieren natuerlich auch in den einschlaegigen Foren und Websites mitlesen. Und dann die entsprechenden Funktionen in ihre Programme einbauen die solche Maskierungen und aehnliche Tricks erkennen.

          Gruss,
          Armin