Hi,
Könnte mir das freundlicherweise mal jemand mit anderen Worten erklären?
Mit Codeeinheiten ist hier Bytes gemeint. UTF-8 Zeichen kommen also mit einer Bytelaenge von 1-4 (Umlaute kommen bspw. als zwei Byte, die meisten westeuropaeischen Zeichen als ein Byte, chinesische zeichen als vier Byte). Die Formulierung "repraesentiert Kodepositionen ..." ist m.E. backpfeifenverdaechtig. ;-)
Was ist ein kanonisches Kodierungsformat?
Sorry, weiss ich auch nicht. Ist seltener Uni-Jargon.
Gruss,
Ludger