Mitleser: Was bedeutet maschinenlesbar

Beitrag lesen

Auf rein technischer Ebene vielleicht, auf semantischer nicht. Zumindest nicht ohne zusätzliche Ansätze wie PDF/A.

Es gibt einige Tools, die Daten einwandfrei aus PDF extrahieren. Die kosten zwar einiges geriebenes, das ist aber kein Grund, deren Existenz zu bestreiten ;)

Dann erleuchte mich mal bitte! Mir würde spontan PDFlib TET als sehr brauchbar einfallen. Aber auch damit allein würde man (bis zur Erreichung der KI, falls es dazu kommt) nie diesselbe Stabilität erreichen, die z.B. eine Rechnung im XML-Format zur maschinellen Weiterverarbeitung erlauben würde. PDF ist zunächst extrem stabil in der visuellen Darstellung, semantisch nur mit Additiven. Das Rechnungsbeispiel hast Du gelesen?