Tach!
Von Trennzeichen bis Trennzeichen ist auch eine Möglichkeit, die Daten zu finden. Ebenso sind nullterminierte Strings in einigen Systemen üblich. Eine Längenangabe ist also kein Erfordernis.
Doch ist es. Wenn eine Datei die utf-8-kodierte Zeichen enthält geparst werden soll, mus jedes einzelne Byte untersucht werden. Und je nachdem welche Wertigkeit das hat, ergibt sich die Länger der im Folgenden zu lesenden Bytes. Also die Anzahl wieviele Bytes für das Zeichen selbst zu lesen sind.
Hier der Algorithmus in PHP leicht verständlich.
MfG