Zugriff über den Index-Operator auf einen UTF-8-String? von Christian Kruse, 10.07.2009 20:45

Beitrag lesen

Zugriff über den Index-Operator auf einen UTF-8-String?

Christian Kruse Homepage des Autors 10.07.2009 20:45

datenbank

你好 Sven,

UTF-8 ist nach meiner Ansicht pflegeleichter, als es hier manchmal dargestellt wird. Das liegt zum einen daran, dass es tatsächlich vollständig bytekompatibel zu beispielsweise ISO-8859-1 ist, also keine merkwürdigen Bytes enthält, die vollkommen aus dem definierten Bereich von ISO-8859-1 herausfallen. Jedes System, was mit ISO-8859-1 grundsätzlich umgehen kann, kann auch mit UTF-8 umgehen.

Was daran liegt, dass es keine Bytes gibt, die nicht in ISO-8859-1 liegen. Hehe. Bei ISO-8859-1 ist jedes Byte belegt, von 0x00 bis 0xFF. De Facto gibt es also kein Zeichensatz, der nicht "ISO-8859-1-kompatibel" in dem von dir definierten Sinn ist.

Vermutlich spielst du auf ISO 8859-1 an, wo die Räume 0x00-0x1F und 0x80-0x9F nicht belegt sind.

Ja, der Bindesrich macht einen Unterschied. Benutzt wird jedoch üblicherweise ISO-8859-1 (man beachte den Bindestrich).

再见,
克里斯蒂安

--
http://wwwtech.de/
Sobald dir ein Gedanke kommt, lache über ihn.
Hochzeit mit Flitterwochen – CFPropertyList: PHP-Klassen zur Manipulation von Apples property lists

Beitrag melden

– Informationen zu den Bewertungsregeln