Gunnar Bittersmann: Nachdenkliches zur BOM die gar keine ist

Beitrag lesen

@@pl

Und bei UTF-8 ergeben die 3 Oktetts EF BB BF selbst mit ihrer Wertigkeit exakt den Codepoint U+FEFF.

Nein. Du hast es eben immer noch nicht verstanden.

Ja nee is’ klar, du bist der einzige, der’s verstanden hat. Alle anderen sind blöd.

0xFEFF ist eben nicht 0xEFBBBF

Das hat auch niemand behauptet.

erst mit einem bestimmten Algortithmus ergibt sich ein Zusammenhang zwischen Oktettenwertigkeiten und Codepoint.

Das ist richtig. Nur dass dieser Algorithmus nichts auf deinem Mist Gewachsenes ist, sondern: die Zeichencodierung.

Nur bei ASCII, ISO-8859-1, UTF16 und UTF32 sind die Oktettenwertigkeiten gleich dem Codepoint, außer den evnt. dort getroffenen Ausnahmeregelungen.

Das ist völliger Unsinn.

Der Oktettwert 61 steht in UTF-8 für den Codepoint U+0061. Wo ist da die Ungleichheit?

Die Oktetts D8 3D DE 00 stehen in UTF-16BE für den Codepoint U+1F600. Wo ist da die Gleichheit?

LLAP 🖖

--
“When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory