hallo forumler,
habe folgendes problem:
muss eine volltextsuche in pdf-files realisieren.
habe mir überlegt, dass ich den textteil der pdf's beim abspeichern in eine mysql-datenbank extrahiere und diesen extrahierten text dann in die datanbank selber ablege und das pdf ins filesystem.
die volltextsuche kann dann mit mysql-bordmittel durchgeführt werden.
soweit sollte meine vorgehensweise ok. sein.
nun zu meinem problem:
wie extrahiere ich den text aus dem pdf?
ich habe verschiedene proprietäre programme gefunden, leider nur mit gui's.
kennt jemand von euch ein modul ev. sogar php/perl-klasse die sowas kann?
oder muss ich mich in die interna von pdf's einarbeiten. wenn ja, kennt jemand ein gutes tutorial.
gruss LenaLuna