Ludger: Kodierungsformat

Beitrag lesen

Hi,

Könnte mir das freundlicherweise mal jemand mit anderen Worten erklären?

Mit Codeeinheiten ist hier Bytes gemeint. UTF-8 Zeichen kommen also mit einer Bytelaenge von 1-4 (Umlaute kommen bspw. als zwei Byte, die meisten westeuropaeischen Zeichen als ein Byte, chinesische zeichen als vier Byte). Die Formulierung "repraesentiert Kodepositionen ..." ist m.E. backpfeifenverdaechtig.   ;-)

Was ist ein kanonisches Kodierungsformat?

Sorry, weiss ich auch nicht. Ist seltener Uni-Jargon.

Gruss,
Ludger