Hallo Felix,
Kennt jemand eine pdf-zu-text-oder-was-anderes-auswertbares-Klasse?
Kurze Frage: Weißt du genau, dass die PDF immer mit OpenOffice.org 2.0 erzeugt wurde? Hast du die Quelldatei von OpenOffice beim Auslesen des Textes zur Verfügung?
Wenn dem so wäre, dann ist die Lösung sehr leicht.
Bei PDF-Dateien gibt es da wahnsinnige Probleme, ich hatte mich selbst die letzten 3-4 Wochen mit PDF - unter Java - rumgeschlagen.
Grüße
Marc Reichelt || http://www.marcreichelt.de/
--
Linux is like a wigwam - no windows, no gates and an Apache inside!
Selfcode: ie:{ fl:| br:> va:} ls:< fo:} rl:( n4:( ss:) de:> js:| ch:? sh:| mo:) zu:)
http://emmanuel.dammerer.at/selfcode.html
Linux is like a wigwam - no windows, no gates and an Apache inside!
Selfcode: ie:{ fl:| br:> va:} ls:< fo:} rl:( n4:( ss:) de:> js:| ch:? sh:| mo:) zu:)
http://emmanuel.dammerer.at/selfcode.html