Hopsel: PDF scannen, Seitenzahl

Beitrag lesen

Hi Urm!

Irgendeine Idee?

Theoretisch ist es möglich, mit PHP einen PDF-Parser zu schreiben, der das kann. Allerdings existieren inzwischen unzählige PDF-Spezifikationsversionen, was den Aufwand ziemlich hochtreibt.

Es gibt zwar ein paar PDF-Parser-Klassen, die in PHP geschrieben sind, allerdings schaffen die es nicht, jedes Dokument zu entziffern, geschweige denn zu den Suchtermen auch noch die entsprechende Seitenzahl herauszufinden.

Allerdings scheint sich, seit dem ich mich damit beschäftigt habe, etwas getan zu haben. Die Antworten zu einer Frage auf Stackoverflow fassen viele Möglichkeiten zusammen, die ich selbst auch noch nicht kenne.

Vielleicht hast du Glück mit ein paar "Zusatzklassen", die über das Zendframwork kommen, oder mit externen Programmen, wie xPDF.

Wenn du zu einem konkreten Ergebnis kommst, lass es mich wissen. Es interessiert mich sehr.

MfG H☼psel

--
"Es gibt Augenblicke, in denen eine Rose wichtiger ist als ein Stück Brot."
Rainer Maria Rilke
Selfcode: ie:% fl:( br:> va:) ls:& fo:) rl:? n4:& ss:| de:] js:| ch:? sh:( mo:) zu:)