Sven Rautenberg: Neues von Unicode

Beitrag lesen

Moin!

http://www.nzz.ch/netzstoff/2003/2003.09.26-em-article94B2M.html

Ja, ganz nett. Der Artikel hat aber an drei Stellen Fehler:

1. Klingonisch ist bereits in Unicode codiert und wurde als Unicode eingereicht, wurde aber vom Komittee zurückgewiesen als "(determined to be inappropriate for encoding)". Und das schon 2001.

http://www.unicode.org/alloc/rejected.html

2. Ägyptische Hiropglyphen sind, im Gegensatz zur Artikelaussage, immer noch nicht in Unicode standardisiert. Die Diskussionen darüber werden sehr kontrovers geführt, welche Zeichen zunächst eingeführt werden sollen. Aktuell ist der Zeichensatz jedenfalls "under investigation".

http://www.unicode.org/alloc/investigation.html

3. Unicode ist kein 16-Bit-Zeichensatz. Auch UTF-8 und UTF-16 sind keine solchen Zeichensätze. UTF-8 codiert ein Unicode-Zeichen mit 1 bis 4 Bytes, UTF-16 codiert ein Zeichen mit 1 bis 2 Words (Doppel-Bytes). Die Tatsache, dass für die bekannten und benutzten Unicode-Zeichen in UTF-16 bislang immer ein Word ausgereicht hat, hat zur Legendenbildung geführt, Unicode wäre ein 16-Bit-Zeichensatz. Dem ist nicht so.

- Sven Rautenberg

--
ss:) zu:) ls:[ fo:} de:] va:) ch:] sh:) n4:# rl:| br:< js:| ie:( fl:( mo:|