Gunnar Bittersmann: If-Schleifen, Javascriptfehler oder Denkfehler?

Beitrag lesen

Hello out there!

Auch hast du keinen Zeichensatz im HTML angegeben, den der Browser benutzen soll, also nimmt er standardmäßig ISO-8859-1, den westeuropäischen Zeichensatz. Dieser hat nur 255 Zeichen.

Nein! Der Zeichensatz für HTML-Dokumente ist _immer_ UCS / Unicode.

Du verwechselst Zeichensatz und Zeichencodierung.

Wenn keine Zeichencodierung angegeben ist, raten Browser ISO 8859-1. (Allerdings „dürfen Benutzerprogramme keinen Standardwert für den »charset«-Parameter annehmen. […] Benutzerprogramme haben auch üblicherweise eine vom Benutzer einstellbare lokale Standardkodierung, die sie anwenden, wenn andere Indikatoren fehlen.“ [HTML401 §5.2.2])

Aber wenn im Quelltext 'ࠕ' steht, ist es völlig egal, in welcher Codierung das Dokument vorliegt*, da die Zeichen '&', '#', 'x', '0', '8', '1', '5', ';' allesamt im Bereich bis U+007F (Basic Latin / „ASCII-Zeichen“) liegen.

Ob das Zeichen U+0815 dann tatsächlich dargestellt wird, hängt freilich davon ab, ob eine etsprechende Schriftart installiert ist.

See ya up the road,
Gunnar

* vorausgesetzt, die Zeichen U+0000 bis U+007F werden durch die Oktettwerte 0 bis 7F codiert.

--
„Und [dieses Forum] soll […] auch ein Fachforum bleiben und kein Psychologieforum werden.“ (Kirsten Evers)