Zeichensaetze, default Zeichensatz, benannte Zeichen usw.
Hallo (Daniel),
Im Arbeitsspeicher stehen Byte-Werte, damit aus diesen lesbare Zeichen (z.B. Buchstaben) werden,
braucht es eine Konvention, die festlegt, welcher Byte-Wert als welches Zeichen dargestellt
werden soll. Dies ist Aufgabe der so genannten Zeichensätze.
Bsp. MS-DOS-Zeichensatz versus ANSI-Zeichensatz:
<img src="http://selfhtml.teamone.de/inter/dos_ansi.gif" border=0 alt="">
selfhtml-Zitat:
"Wo im ANSI-Zeichensatz beispielsweise ein kleines deutsches ü liegt, bietet der erweiterte
DOS-Zeichensatz eine hochgestellte 3 an."
Nachgefragt:
1.
- Die default Zeichensatz-Angabe im Meta-Tag. Was bewirkt sie genau?
Der Browser weiß dann, welchen Zeichensatz er verwenden muss.
Ein Zeichensatz ordnet einem oder mehreren bytes ein Zeichen zu.
Bei Zeichensätzen, die die ASCII-Zeichen anderen bytes zuordnen, gibt es da u.U. schwierigkeiten.
Zumindest ist die Erkennung schwieriger und im allgemeinen Fall unmöglich.
Ich gehe davon aus gemeint ist, was ich oben nochmals geschrieben habe. (denkprozess ;-))
Den Zeichensatz innerhalb des Dokuments zu definieren, dass in benutzt ist allerdings schwierig.
Vor allem bei Metatags weiß der Browser noch nicht einmal genau, wo er die Angabe findet.
Was ist mit (bei Metatags weiß der Browser noch nicht) gemeint und was mit (wo er die Angabe findet)?
Mir ist jetzt klar geworden, dass eine Umschreibung ohne einen Zeichensatz-Bezug Unsinn ist,
weil die Umschreibung nichts anderes macht, als einen Byte-Wert an der betreffenden Stelle im
HTML-Dokument zu "setzen". Und diser Byte-Wert bezieht sich auf einen bestimmten Zeichensatz,
wenn dieser nicht zur Verfügung steht, gibt es auch nicht 100% das umschriebene Zeichen an dieser Stelle.
Schriftart und Zeichensatz, wer hat eigendlich das Sagen?
Beide. Der Zeichensatz ordnet den Bytes Zeichen zu und die Schriftart den Zeichen eine
graphische Darstellung.
Gut. Und wie sind nun Schriftart und Zeichensatz "verzahnt"?
Der Zeichensatz bekommt den Byte-Wert und ordnet diesem ein Zeichen zu.
Die Schriftart bekommt dann den Auftrag vom Zeichensatz dieses Zeichen bitte darzustellen.
Und alle hoffen, das die Schriftart es kann.
Jetzt hab ichs einigermassen kapiert, oder?
Hier ein kleiner "selfhtml8-Kontext-Joke" zu benannten Zeichen:
"Erläuterung:
Ersetzen Sie die deutschen Sonderzeichen wie im obigen Beispiel durch die
entsprechenden Zeichenfolgen - keine Sorge, die Web-Browser verstehen das
und zeigen die Zeichen korrekt an."
http://selfhtml.teamone.de/html/allgemein/zeichen.htm#umlaute
Ist es nicht eher "unsauber" Umlaute nicht zu maskieren?
Nein, das ist nicht Unsauber.
Kann ich hier noch ein Argument haben? Für die Praxis, wann maskieren und wann nicht?
Wo finde ich noch weitere Angabe zum Default-Zeichensatz (Meta-Angabe), ausser:
http://selfhtml.teamone.de/html/kopfdaten/meta.htm#zeichensatz
Viele Grüsse
Thomas N