pl: Nachdenkliches zur BOM die gar keine ist

Beitrag lesen

problematische Seite

hi,

Spaß beiseite: Eine umständlich erscheinende Lösung ist oft die einzige, die für eine gegebene Menge an Problemen hinreicht.

Das habe ich doch längst widerlegt. Man kann mit einem einzigen Byte 255 verschiedene Kodierungen auszeichnen oder 127 verschiedenen Kodierungen + 1 Byte für die Byteorder. Da wäre lediglich ein einziges Byte zu lesen und es wäre, egal welche Kodierung danach vorliegt, stets nur ein einziges Byte zu lesen.

Eher so, als würde man über einem in lateinischen Schriftzeichen geschriebenen Text vermerken, dass er in Spanisch verfasst ist.

Genau das wäre sinnvoll: Man einigt sich auf eine gemeinsame Sprache. Man könnte z.b. auch UTF16BE oder UTF32LE einbauen und dafür sorgen, daß diese BOM immer dieselbe Länge hat indem man auf eine feste Länge mit Nullbytes auffüllt (c Style). Eine solche ASCII-BOM wäre dann sogar für den Menschen lesbar.

Und dann bekäme das alles überhaupt einen Sinn. GGA