Robert B.: PDF über PHP/... auslesen

Beitrag lesen

Moin Rudolf,

was heißt denn in Deinem Kontext lesbar?

Optimalerweise wäre natürlich ein bereits wohlgeformtes standardisiertes Ausgabeformat (aka JSON) erstrebenswert.

Sehe aber ein, dass das so seine groben Denkfehler hat, da z.B. ein Word Dokument per se eben nicht aus einem JSON Format in eine PDF konvertiert wurde.

Ich frage anders herum:

Welches ist dein Ausgangsformat für das Konvertieren – ein Office-Format oder PDF?

Office-Formate kannst Du direkt in weiterverarbeitbare Formate konvertieren, das wäre viel einfacher als

  • PDF erzeugen
  • PDF wieder parsen.

Was mir da als Endausgabe nun genau schimpfend entgegenspu(c)kt ist daher sekundär, so long as die Resultate mich nicht in Binary verprügeln, sondern irgendwie lesbar sind

Binary bekommst Du mittlerweile aber tendenziell eher mit PDF als mit modernen Office-Formaten.

Viele Grüße
Robert