Christoph: Nachtrag

Beitrag lesen

Moin.

Ja, aber wann hat man schon Texte die nur aus entsprechenden Zeichen bestehen? Wohl eher selten, da die meisten Formate irgendwelche Markup-Informationen beinhalten - darum sagte ich ja, dass es nur in Sonderfällen platzsparender ist.

UTF-8 kodiert ASCII-Zeichen mit einem Byte, dafür alle Zeichen der BMP ab U+0800 mit 3 Byte. UTF-16 benötigt in beiden Fällen 2 Byte. Sobald der eigentliche Text meht Zeichen enthält als das Markup, ist UTF-16 die 'sparsamere' Kodierung.

Christoph