Daniel Thoma: Griechische Pfirsiche

Beitrag lesen

Hallo dedlfix,

Hat man nicht, denn ein einzelnes asiatisches Zeichen lässt sich sowieso nicht mit nur einem Byte darstellen.

Ja es ist ein Faktor 1,5 oder so. Bei UTF-8 bliebe es so.

Dafür sind es einfach zu viele. Außerdem ist es zumindest im Chinesischen und Japanischen so, dass ein Zeichen für eine Silbe oder vielfach auch für ein ganzes Wort steht.

Naja, relevant ist der Faktor bezüglich der Gleichen Sprache. Man kann natürlich sagen, dass Textdaten sowieso nur noch einen geringen Anteil der Daten ausmachen und wenn man sie komprimiert, ist der Zeichensatz ohnehin nicht mehr relevant. Allerdings verwendet z.B. UTF-32 trotzdem niemand, obwohl es so toll einfach ist.

你好 benötigt 6 Bytes, »Guten Tag« hingegen 9.

"Hi" benötigt nur zwei Bytes, da kann Japanisch gar nicht mehr drunter kommen ;-)

Grüße

Daniel