Tach!
Von Trennzeichen bis Trennzeichen ist auch eine Möglichkeit, die Daten zu finden. Ebenso sind nullterminierte Strings in einigen Systemen üblich. Eine Längenangabe ist also kein Erfordernis.
Doch ist es. Wenn eine Datei die utf-8-kodierte Zeichen enthält geparst werden soll, mus jedes einzelne Byte untersucht werden. Und je nachdem welche Wertigkeit das hat, ergibt sich die Länger der im Folgenden zu lesenden Bytes. Also die Anzahl wieviele Bytes für das Zeichen selbst zu lesen sind.
Wir drehen uns im Kreis. Das ist für das Dekodieren notwendig, nicht für das Parsen der Daten an sich. Das Kodieren und Dekodieren kann als eigener Vorgang stattfinden, genauso wie das Kodieren und Dekodieren in elektrische oder anderweitige Signale für noch weiter unten liegende Mechanismen der Datenspeicherung oder des Transports.
dedlfix.