Hi,
Ich konnte allerdings nur eine einzige Mail-Adresse auslesen. Und zwar musste ich diese dazu extra als Hyperlink definieren. Wenn ich diese als einfachen Text eingegeben habe, konnte ich diese nicht mehr aus dem sonstigen „Gekräusel“ herauslesen.
Hier gibt es ein Tools namens pdf2txt:
http://www.chip.de/downloads/PDF2TXT-3.2_13011980.html
http://www.comp.eonworks.com/scripts/convert_pdf_to_text-20040418.html
Hab noch keins davon ausprobiert, aber laut Beschreibung können sie den Text aus PDFs in ein ASCII-File schreiben. ASCII-Files kann man dann leicht parsen und Mail-Adressen herauslesen.
Es gibt aber sicher auch Module/Funktionen für Perl oder PHP (und bestimmt auch für die meisten anderen Programmiersprachen) mit denen du sowas selber nachprogrammieren könntest.
mfG,
steckl