Rudolf: PDF über PHP/... auslesen

Beitrag lesen

Da gibt es viele PHP-Skripte (z.B.: https://github.com/topics/pdf-reader), die du in Dein Backend einbinden kannst .

Da war kein einziges PHP Skript für allgemeine Konvertierungszwecke dabei 😆

was heißt denn in Deinem Kontext lesbar?

Optimalerweise wäre natürlich ein bereits wohlgeformtes standardisiertes Ausgabeformat (aka JSON) erstrebenswert.

Sehe aber ein, dass das so seine groben Denkfehler hat, da z.B. ein Word Dokument per se eben nicht aus einem JSON Format in eine PDF konvertiert wurde.

Was mir da als Endausgabe nun genau schimpfend entgegenspu(c)kt ist daher sekundär, so long as die Resultate mich nicht in Binary verprügeln, sondern irgendwie lesbar sind - mit anderen Worten:

Schreibe ich "Hello World!" in ein WORD / Open Office und verpacke es in einer schönen PDF mit Mascherl oben drauf, sollte in der Textausgabe dieser PDF wieder irgendwo "Hello World!" zu finden sein (den Rest scrape ich mir dann schon irgendwie zusammen...)