Henryk Plötz: Gibt es hier Unicode Spezialisten?

Beitrag lesen

Moin,

Meine Posting bezog sich nicht außschließlich auf Henryk.

So ein Zufall ;-) Meins nicht ausschließlich auf dich. Es ging mir mehr darum einer Sichtweise Ausdruck zu verleihen. Unter dieser Betrachtungsweise würden sich dann einige Fragen die hier ab und zu auftauchen einfach gar nicht mehr stellen.

Die Spezifikation selbst spricht von "Unicode-Format", also ist es falsch wenn ich das verwende.

Ich habe sie nicht gelesen, könntest du mir also bitte die Stelle zeigen? Weit und breit lese ich nur von 'Unicode Transport Format'.

Ich sagte: "Das beduetet, dass ein Zeichen in UFT-8 8-bit Länge hat."
Daraufhin wird mir lang und breit erklärt, dass UTF keine Zeichentabelle sei (wo habe _ich_ das gesagt?).

Wenn ich dir persönlich etwas erklären wollte, dann würde ich dir eine Mail schicken[1]. Hier[tm] ist aber ein öffentliches Forum in dem mehrere Leute mitlesen (manchmal sogar der Ursprungsautor des Threads) und das ein Archiv führt.

Dann beginnt man mit dem Unterricht zwischen bits und bytes und bringt das dann selbst ordentlich durcheinander und widerspricht sogar dem, was in den Dokumenten von unicode.org steht z.B. unter:
http://www.unicode.org/faq/utf_bom.html#37

Da ist nichts durcheinander (von Bits und Bytes war sowieso überhaupt nie die Rede), da ist aber ein Missverständnis. Du schriebst, dass in UTF-8 ein Zeichen 8 Bit habe. Ein Zeichen ist für mich (und ich nehme einfach mal frecherweise an auch für andere) sowas wie ä, und das hat bekanntermaßen in UTF-8 16 Bit. Ich wollte einfach sagen, dass in UTF-8 ein Zeichen aus 8, 16, 24 oder 32 Bit besteht, in UTF-16 aus 16 oder 32 Bit und in UTF-32 aus 32 Bit.[2]

Du scheinst 'Zeichen' aber einfach als Übersetzung für 'code unit' zu verwenden.

[1] Und ja, mir ist klar, dass es eher nicht dazu kommen wird. Wenn überhaupt umgekehrt.
[2] Der Korrektheit wegen und um Missverständnisse vorzubeugen möge man bitte "ein Zeichen aus ... besteht" als "ein Codepoint durch ... dargestellt wird" lesen.

--
Henryk Plötz
Grüße aus Berlin
~~~~~~~~ Un-CDs, nein danke! http://www.heise.de/ct/cd-register/ ~~~~~~~~
~~ Help Microsoft fight software piracy: Give Linux to a friend today! ~~