Und das Ganze nun mit einer abstrakten Denkweise ergänzen: So ist auch Text nur eine Bytesequenz. Oder anders ausgedrückt: Ein Parser liest nicht nur Text sondern Bytesequenzen. Und Bytes kennen keine Token, Zeichen oder gar Zeichenkodierungen -- genau das ist das was der Parser wissen muss und das ergibt einen bestimmten Algorithmus, z.B.
- lese 4 byte
- die ergeben als Big Endian einen 32Bit-integer
- dieser integer sagt dir wieviele bytes du lesen musst, um an den Inhalt zu kommen
wiederhole 1..3 solange, bis es nichts mehr zu lesen gibt. Nun mach aus den Inhalten ein Array, oder fasse jeweils immer 2 Array-Elemente als key => value auf. Oder nimm immer 3 Elemente als Entity-Attribute-Value ... meine Güte, das hat sogar meine Frau verstanden ;)