suit: Nachtrag

Beitrag lesen

UTF-8 kodiert ASCII-Zeichen mit einem Byte, dafür alle Zeichen der BMP ab U+0800 mit 3 Byte. UTF-16 benötigt in beiden Fällen 2 Byte. Sobald der eigentliche Text meht Zeichen enthält als das Markup, ist UTF-16 die 'sparsamere' Kodierung.

In den meisten Fällen dürfte bei Webseiten der Markup-Anteil aber den Nutztext überwiegen (verstärkt durch schlechte Programmierung, Redundanzen und Inline-CSS/-JavaScript). Bei der chinesischsprachigen Wikipedia-Startseite ist das Verhältnis von Markup zu Nutztext etwa 10:1 - beim Artikel über den Zweiten Weltkrieg immerhin noch etwa 3:1.