Gunnar Bittersmann: Datei-Konvertierung von utf-8 zu utf-16

Beitrag lesen

@@suit:

nuqneH

Nein, es war so gedacht, dass man zeichen der BMP 1:1 ohne komplizierte Multibyte-Codierung darstellen kann.

Die Kompliziertheit liegt im Auge des Betrachters. Ein Mensch mag es nicht naheliegen, ein paar Bits zu shiften. Ist auch nicht seine Aufgabe. Ein Computer zuckt nicht einmal mit der Wimper.

Unter dem von dir genannten verstehe ich "verlustfrei" :) afaik gibt es aber keine verlustbehafteten Zeichencodierungsformen.

Wenn ein Text, in dem Zeichen jenseits von U+0100 vorkommen, in ISO 8859-1 codiert wird, gehen Informationen verloren. Entweder alle (wenn der Algorithmus abbricht) oder zumindest die Zeichen jenseits von U+0100.

Qapla'

--
Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
(Mark Twain)