Antwort an „Rolf B“ verfassen

Hallo André,

Da verwechselt du Zeichensatz (Unicode) und Zeichencodierung. Von denen gibt's einige, die aber alle (außer utf8mb3 in mysql) den vollständigen Unicode darstellen können.

UTF-8: 1-4 Bytes/Zeichen. Das Niederwertigste immer zuerst. Gelegentlich auf 3 Byte pro Zeichen kastriert (MySQL). Mit oder ohne BOM.

UTF-16: 2 Bytes/Zeichen in der BMP, 4 Bytes darüber. Mit oder ohne BOM. Little oder Big Endian.

UTF-32: immer 4 Bytes/Zeichen. Mit oder ohne BOM. Little oder Big Endian.

Was der Browser anzeigt und ins Clipboard stellt, ist immer Unicode, codiert nach Maßgabe des verwendeten Betriebssystems.

Rolf

--
sumpsi - posui - obstruxi
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar

Ihre Identität in einem Cookie zu speichern erlaubt es Ihnen, Ihre Beiträge zu editieren. Außerdem müssen Sie dann bei neuen Beiträgen nicht mehr die Felder Name, E-Mail und Homepage ausfüllen.

abbrechen