Hallo André,
Da verwechselt du Zeichensatz (Unicode) und Zeichencodierung. Von denen gibt's einige, die aber alle (außer utf8mb3 in mysql) den vollständigen Unicode darstellen können.
UTF-8: 1-4 Bytes/Zeichen. Das Niederwertigste immer zuerst. Gelegentlich auf 3 Byte pro Zeichen kastriert (MySQL). Mit oder ohne BOM.
UTF-16: 2 Bytes/Zeichen in der BMP, 4 Bytes darüber. Mit oder ohne BOM. Little oder Big Endian.
UTF-32: immer 4 Bytes/Zeichen. Mit oder ohne BOM. Little oder Big Endian.
Was der Browser anzeigt und ins Clipboard stellt, ist immer Unicode, codiert nach Maßgabe des verwendeten Betriebssystems.
Rolf
--
sumpsi - posui - obstruxi
sumpsi - posui - obstruxi