Gunnar Bittersmann: Nachdenkliches zur BOM die gar keine ist

Beitrag lesen

problematische Seite

@@pl

So isses. D.h, wenn man die BOM interpretieren will, muss man dazu wissen mit welcher Kodierung sie erstellt wurde

Nein. Wenn man eine Oktettsequenz als Text interpretieren will, muss man dazu wissen, mit welcher Codierung sie erstellt wurde.

Das BOM ist Teil der Oktettsequenz, also in derselben Codierung.

und wieviele Bytes dafür zu lesen sind.

Das ergibt sich aus der Codierung.

Bleibt immer noch die Frage offen wozu das alles gut sein soll.

Um bei Codierungen wie UTF-16 und UTF-32, in denen beide Reihenfolgen – Big Endian und Little Endian – möglich sind, zu erkennen, welche denn nun verwendet wurde. Also ob bei UTF-16 die Oktettsequenz 01 23 für U+0123 ģ latin small letter g with cedilla oder für U+2301 ⌁ electric arrow steht.

LLAP 🖖

--
“When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory