Cheatah: Meta Frage

Beitrag lesen

Hi,

Ich trau mich gar nicht fragen, worin der Unterschied zwischen utf-8 und iso xxxxx besteht.

kurz gesagt: ISO-8859-x kodiert alle Zeichen in den 128 Werten, die ASCII in einem Byte (also 256 Werten) übrig lässt. Somit ist die Gesamtmenge an unterschiedlichen Zeichen bei jeder einzelnen ISO-8859-x-Kodierung auf 256 beschränkt; jedes Byte der Datei repräsentiert genau eines von 256 möglichen Zeichen. Zeichen, die nicht Teil dieser 256 Möglichkeiten sind, können nicht dargestellt werden.

Bei UTF gibt es ein Flag-Bit, welches sagt, dass ein weiteres Byte Teil des Zeichens ist. Da das Schema hierzu fortgeführt werden kann, gibt es theoretisch mehr als 2 Millionen mögliche Zeichen, die hiermit abgebildet werden können. Es gibt gegenwärtig nicht genug Zeichen auf der Welt, um eines zu finden, welches nicht mit UTF abgebildet werden könnte.

Beide geht laut ChrisB wohl nicht...

Nein, es gibt keine Informationsquelle, die anzeigen könnte, welche Kodierung für das nächste Zeichen gewählt wurde. Der Organisationsaufwand wäre auch absurd - zumal es dank UTF keinen Use-Case für so etwas gäbe. (Um genau zu sein: UTF-16 käme dieser Idee als Spezialfall am nächsten, wird aber außerhalb asiatischsprachiger Dokumente gewöhnlich wegen Platzverschwendung zugunsten von UTF-8 ignoriert.)

Aber bitte bleicher : einfach - möglichst kurz und einfach (ist schon zu spät für komplexes *g*)

Oh, sorry ;-)

Cheatah

--
X-Self-Code: sh:( fo:} ch:~ rl:| br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
X-Will-Answer-Email: No
X-Please-Search-Archive-First: Absolutely Yes