PDF Dokumente durchsuchen
alex
- perl
Hi,
kann mir jemand sagen wie ich PDF Dokumente einfach durchsuchen kann?
Oder gar wie ich eine Indexierung darüber mache. Mir ist klar, dass manche PDF Dokumente nur Bilder sein können, aber egal...
Verweise auf Module würden mir schon ausreichen, vorausgesetzt die sind ordentlich dokumentiert, leider trifft das kaum für die CPAN teile zu :(
danke
alex
Hallo,
ich verwende pdftohtml, dann kannst du deinen Spider drauflosschicken.
Verweise auf Module würden mir schon ausreichen, vorausgesetzt die sind ordentlich dokumentiert, leider trifft das kaum für die CPAN teile zu :(
Mir wäre jetzt auf Anhieb kein Modul bekannt (oO), zum letzten Teil des Satzes: Die grüne Pille heute morgen vergessen? Guter code kommentiert sich selbst :P
gruss
Hallo,
ich verwende pdftohtml, dann kannst du deinen Spider drauflosschicken.
Verweise auf Module würden mir schon ausreichen, vorausgesetzt die sind ordentlich dokumentiert, leider trifft das kaum für die CPAN teile zu :(
Mir wäre jetzt auf Anhieb kein Modul bekannt (oO), zum letzten Teil des Satzes: Die grüne Pille heute morgen vergessen? Guter code kommentiert sich selbst :P
gruss
ich nutze jetzt pdftotext, das scheint auch ganz ok zu sein.
(btw ich habe aber keine lust bei der recherche wie ich irgendwas angehe erst code zu studieren um zu sehen, dass das modul mir nix nützt :P)
thx
alex