Hi!
Das lässt sich ändern: http://wiki.selfhtml.org/wiki/Doku:Grundlagen/Zeichenkodierung_und_geschriebene_Sprache
Autsch, was muss man da lesen: „Bei 1-Byte-Codierungen (für Zeichensätze mit bis zu 256 Zeichen) spielt die Unterscheidung zwischen Zeichensatz und Zeichencodierung keine praktische Rolle.“
Das ist Unsinn. Aber wie du sagtest: Das lässt sich ändern.
Wenn du jetzt noch erklärst, wie es deiner Meinung nach richtig wäre, denn ich wüsste jetzt nicht, welcher praktischen Nutzen sich an der Stelle von einer Unterscheidung ergibt.
„Der Zeichensatz für HTML-Dokumente ist seit Version 4.0 stets Unicode.“
Eben. Aber „[d]as bedeutet nicht, dass alle HTML- und XML-Dokumente als Unicode codiert werden müssen […]“ [DOC-CHARSET] Auch bei einem ISO-8859-1-codierten HTML-4-Dokument ist der Zeichensatz Unicode.
Die Unterscheidung zwischen Zeichensatz und Zeichencodierung spielt immer eine Rolle.
Und was genau bemängelst du jetzt am Wiki-Text? Nach dem zitierten Satz geht es ja noch weiter. Vielleicht kommt durch dessen Formulierung das Ansinnen nicht richtig rüber, aber ich sehe da jetzt nicht, welchen inhaltlichen Handlungsbedarf du da genau siehst.
Ich finde ja übrigens "als Unicode codiert" nicht richtig. Unicode ist keine Kodierung sondern ein Zeichensatz. Aber das W3-Dokument ist nicht meine Baustelle.
Es gibt praktisch keine für die polnischen Nicht-ASCII/-ISO-8859-1-Zeichen.
Was denn nun: Nicht-ASCII oder Nicht-ISO-8859-1? Wenn erstes: ó
Das eine Zeichen (oder wieviele es nun genau sind) macht das Kraut auch nicht fett. Wenn man das Vorhaben mit ISO-8859-1 als Kodierung der Seite(n) umsetzen will, kommt man so oder so an den NCRs nicht vorbei. Aber dieser Aspekt der Diskussion bringt niemanden so richtig weiter. Es wäre wichtiger, zu klären ob es triftige Gründe gibt, die gegen eine Umstellung des Projekts auf UTF-8 sprechen.
Lo!