hotti: Was bedeutet maschinenlesbar

Beitrag lesen

Der Inhalt eines pdf ist für Menschen gemacht.

Der Inhalt einer PDF-Datei ist für den PDF-Reader gemacht.

In einer Auflistung einer Rechnung sind die einzelnen Positionen für dich gut erkennbar, aber ein Programm tut sich schwer darin eine Struktur zu finden.

Der PDF-Reader weiß sehr wohl, mit welchem Algorithmus die Daten in der PDF-Datei abgelegt sind und tut sich überhaupt nicht schwer, die Daten aus der Datei zu lesen: Er wendet ganz einfach den Algorithmus an.

In XML sind die Daten strukturiert

Das sind sie in der PDF-Datei auch.

und mit einem Namen versehen.

Es gibt ungezählte andere Algorithmen zum Abbilden von Datenstrukturen (Array, String, Hash) auf Bytebene.

Ein Programm erkennt also was die Artikelnummer, die Anzahl und der Preis sind. Weils jedes mal dabei steht.

Schlüssel-Werte-Paare sind selbstverständlich auch auf Byte-Ebene abbildbar, das ist nicht auf XML beschränkt. Guckst Du hier

Der Mensch kann das zwar auch lesen und sich zusammenreimen, aber es ist nicht das was letztendlich als Ausgabe eines Programms für den Anwender herauskommt.

Der Mensch muss die PDF-Datei überhaupt nicht lesen können: Das macht der PDF-Reader.

XML ist nicht die einzige Möglichkeit, Daten strukturiert in Dateien abzubilden!