Der Martin: kein ♂ oder ♀ im title-Element?

Beitrag lesen

Hallo,

Ist UTF-8 (oder eher UTF-16) heute Standard unter Windows?

da muss man unterscheiden zwischen der internen Speicherung von Strings und der externen, also bei der Übertragung oder in Dateien. Intern verwendet Windows seit Version 4 (NT4 bzw. Windows 95) bevorzugt UCS-2, das ist eine Teilmenge von UTF-16, kann aber ebensogut mit Single-Byte-Codierungen umgehen. Dann ist, wie du schon erwähnst, Windows-1252 der typische Vertreter - zumindest im deutschen Sprachraum.

Von welcher Systemkodierung mit welchen Auswirkungen für das hier angesprochene Problem kann ich heute beim an OS-Konfiguration durchschnittlich (un-) interessierten Windowsuser (noch mit XP oder gar Vista) ausgehen?

Im Web kann dir das eigentlich egal sein. HTML verwendet *grundsätzlich* Unicode, und das kann in verschiedenen Codierungen angeliefert werden. Dein Problem hier ist ja nicht, dass ein Browser nicht mit UTF-8 umgehen könnte - du verwendest ja sogar numerische Zeichenreferenzen, die völlig unabhängig von der Zeichencodierung sind. Dein Problem in diesem Fall ist vielmehr, dass die Zeichen zwar richtig erkannt und verarbeitet werden, einige Fonts aber kein Symbol dafür auf Lager haben.
Browser improvisieren in so einem Fall oft, indem sie das Zeichen ersatzweise aus einem anderen Font holen; der systemeigene Font-Renderer von Windows ist aber ein fauler Sack und tut das nicht. Er stellt dann eben das Ersatzzeichen (das Kästchen) dar.

Deswegen sollte dir die korrekte Darstellung weniger gebräuchlicher Zeichen innerhalb einer Webseite keine Schwierigkeiten machen; in Fensterbereichen, die nicht der Kontrolle des Browsers unterliegen (wie Titelleiste, Tab-Beschriftung oder Buttons in der Taskleiste) aber eventuell doch.

Ciao,
 Martin

--
Verliebt:    Er spricht, sie lauscht.
Verlobt:     Sie spricht, er lauscht.
Verheiratet: Beide sprechen, und die Nachbarn lauschen.
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(