Hallo!
Ich lese momentan ein (älteres) Buch über Spam-Abwehr. Darin wird u.a. beschrieben, wie man E-Mail-Adressen auf Internetseiten vor Web Crawlern verbergen kann. Der Autor geht hierbei auch auf die Möglichkeit ein, Mail-Adressen in PDF- und Flash-Dateien zu verstecken. Diese Möglichkeit wäre allerdings unsicher, da PDF und Flash automatisch ausgelesen werden könnten, weil diese Dateien >eine Beschreibung der Seite< enthielten.
Beschreibung der Seite< hört sich nun so nach Seitenbeschreibungs-Sprache an. Und falls ich mich nicht täusche, dann sind damit Sprachen wie HTML gemeint; wo der darzustellende Inhalt von Tags eingeschlossen wird, welche die Darstellung regeln, während alles in einem einfachen Texteditor eingegeben werden kann - also als Klartext vorliegt.
Ich weiß auch, dass Google PDFs auslesen kann. Ich habe daher testweise zum Writer aus der Open Office-Suite gegriffen und ein Dokument erstellt, das ich danach in ein PDF habe exportieren lassen. Ich konnte allerdings nur eine einzige Mail-Adresse auslesen. Und zwar musste ich diese dazu extra als Hyperlink definieren. Wenn ich diese als einfachen Text eingegeben habe, konnte ich diese nicht mehr aus dem sonstigen „Gekräusel“ herauslesen. Mit Flash-Dateien scheint das überhaupt nicht zu funktionieren.
Ich habe es auch mal mit einem Hexmonitor versucht. Aber auch damit habe ich den Text nicht mehr auslesen können. Ist das Buch (2005) nicht mehr auf dem aktuellen Stand? Komprimieren und/oder verschlüsseln die neuen Versionen von PDF und Flash die enthaltenen Texte? Die müssten doch trotzdem irgendwie auslesbar sein? Oder werden die als Vektoren abgelegt? Das wäre doch total ineffizient. Oder mache ich irgendwas falsch? Wie macht Google das denn? Sind Mail-Adressen in PDF- und Flash-Dateien nun sicher oder nicht?