Liebe Mitdenker,
liebe Wissende,
liebe Neugierige,
ja!
Wie passt das zusammen.
UTF-8 benötigt doch eigentlich vier Bytes pro Zeichen:
http://de.wikipedia.org/wiki/UTF-8*Bis zu* vier. Für viele Zeichen sind es aber weniger.
Spielt MySQL hier Statistik-Roulette?
Nein. Lange Zeit hat MySQL UTF-8 gar nicht voll unterstützt, sondern nur Zeichen bis zu drei Byte Länge erlaubt.
Seit 5.5.3 gibt es das Encoding utf8mb4 – und das bietet dann endlich vollen UTF-8-Support
https://mathiasbynens.be/notes/mysql-utf8mb4
Danke. Das war äußerst erhellend!
Es werden ja tatsächlich nur 21 Bits von 32 für die eigentlichen Daten benutzt bei UTF8. Jetzt verstehe ich auch den enormen Anstieg des Speicherplatzbedarfes, nachdem wir unsere Datenbanken von ISO auf UTF8 umgestellt haben. Da werden tatsächlich drei Bytes verballert, auch wenn nur eins benötigt werden würde.
Spirituelle Grüße
Euer Robert
Möge der Forumsgeist wiederbelebt werden!