Gunnar Bittersmann: Umlaute im Validator

Beitrag lesen

Rouven,

mal so eine Ergänzungsfrage dazu: Gilt das "nur" für die Validierung oder generell?

Was den strengen Validator überzeugt, sollte für fehlertolernte Browser erst recht verständlich sein.

Würde ja dann heißen, dass ich vom heutigen Tag an einfach alle meine Webseiten als 8859-1 ausweise und kein einziges Zeichen mehr durch Entities ersetzen müsste. Stimmt das?

Nein. Du kannst nicht deine Webseiten als irgendwas ausweisen, sondern musst diejenige Zeichencodierung angeben, mit der du dein Dokument abgespeichert hast.

Mit ISO 8859-1 kannst du nicht alle Zeichen codieren, sondern nur 256 (wobei da auch Steuerzeichen darunter sind). Von „kein einziges Zeichen mehr durch Entities ersetzen“ kann keine Rede sein, mit ISO 8859-1 lässt sich das €-Zeichen ebensowenig codieren wie „, “, –, …; dafür müsstest du weiterhin €, „, “, –, … schreiben.

Das sparst du dir, wenn du UTF-8 als Codiereung wählst, damit lassen sich alle UCS-/Unicode-Zeichen codieren. (Die Zeichen <, >, &, ", ', die in HTML/XML eine Sonderbedeutung haben, müssen selbstverständlich weiterhin durch Entities oder NCRs maskiert werden.)

Wenn ja, gabs das vor 3 oder 4 Jahren auch schon, oder warum wurde das damals überall angepriesen?

Ja, gab’s schon. Wer weiß, wem du da auf den Leim gegangen bist.

Das Archiv ist übrigens voll mit Threads zu Zeichencodierungen, der letzte war erst vor wenigen Tagen.

Live long and prosper,
Gunnar

--
„Weisheit ist nicht das Ergebnis der Schulbildung, sondern des lebenslangen Versuchs, sie zu erwerben.“ (Albert Einstein)