karl-heinz: Utf-8 Unicode

Beitrag lesen

Moin dedlfix,

Unicode im allgemeinen Gebrauch ist auf ~1 Mio Zeichen begrenzt. Diese Restriktion hat auch was mit den ganzen Transformationen zu tun, um ein gewisses Maß an Integration zu gewährleisten (UTF-8, UTF-16).

Welchen praktischen Gebrauch meinst du? Könntest du etwas konkreter erklären, was das bedeutet?

Anders gesagt, für allgemein gebräuchliche Zeichen reichen ~1 Mio aus. Aus rein technischer Sicht könnte Unicode mehr definieren.

siehe auch http://www.unicode.org/faq/utf_bom.html

Ab Visual Studio 2013 wird übrigens auf Multibyte-Strings verzichtet, dass ist eine spezielle Form von Kodierung auf Windows-Systemen.

... Die Unterstützung für diese ist allerdings gemäß http://msdn.microsoft.com/en-us/library/vstudio/5z097dxa(v=vs.120).aspx nicht eingestellt sondern nur in ein Add-On verschoben worden.

Wobei ich noch irgendwo gelesen habe, dass sich Projekte damit nicht kompilieren lassen, auch wenn eine entsprechende Option in den Projekteinstellungen noch vorhanden ist. Eine Unterstüztung heißt ja auch erstmal, dass man "irgenwas" damit noch machen kann. Zum Beispiel das Einlesen von Daten die auf MBCS beruhen.

Da es sich um MFC-Bibliotheken handelt, betrifft das im Prinzip auch nur "herkömmliche" Programme, für .NET war ja schon immer Unicode die Grundlage.

Für Windows auch. Sofern ich mich recht erinnere, beruht der Windows Kernel ab NT auf UCS2 (also der BMP) und später auf UTF-16. Ob die Daten allerdings wirklich korrekt sind, wird erst bei der Darstellung selbiger überprüft (wenn überhaupt). Die String-Routinen auf nativem C++ waren aber auch schon immer ... bescheiden.