Mitleser: Was bedeutet maschinenlesbar

Beitrag lesen

Der Inhalt eines pdf ist für Menschen gemacht.

Der Inhalt einer PDF-Datei ist für den PDF-Reader gemacht.

Wenn Du dich auf den Schritt "Software macht aus PDF Darstellung auf Bildschirm/Papier" beziehst: ja.

In einer Auflistung einer Rechnung sind die einzelnen Positionen für dich gut erkennbar, aber ein Programm tut sich schwer darin eine Struktur zu finden.

Der PDF-Reader weiß sehr wohl, mit welchem Algorithmus die Daten in der PDF-Datei abgelegt sind und tut sich überhaupt nicht schwer, die Daten aus der Datei zu lesen: Er wendet ganz einfach den Algorithmus an.

BTW: Wenn das so einfach wäre, hätte z.B. der FireFox PDF-Reader weniger Probleme mit der korrekten Darstellung von PDF.

In XML sind die Daten strukturiert

Das sind sie in der PDF-Datei auch.

In einem XML sind die Daten zur maschinellen Weiterverarbeitung strukturiert, in einem PDF zur exakten visuellen Darstellung, außer man nimmt PDF/A-Konzepte hinzu.

[...]

XML ist nicht die einzige Möglichkeit, Daten strukturiert in Dateien abzubilden!

Wer hat das denn hier behauptet?