Antwort an „Gunnar Bittersmann“ verfassen

@@Rolf B

da der Zeichensatz von XML-Dokumenten (wie auch von HTML-Dokumenten) immer Unicode ist

Sein sollte.

Nein, ist.

Zumindest habe ich schon genug XML Dokumente mit einem Einbyte Encoding gesehen

Du verwechselst Zeichensatz und Zeichencodierung.

Der Zeichensatz von XML/HTML-Dokumenten ist Unicode. Immer. Das heißt, man kann in XML/HTML-Dokumenten alle Unicode-Zeichen verwenden.

Wenn man ein XML/HTML-Dokument speichern/übertragen will, werden die Zeichen codiert (in Bytesequenzen). Bei einer Unicode-Codierung (UTF-8, UTF-16) geht das problemlos.

Bei anderen Codierungen (ASCII, ISO 8859) müssen damit nicht codierbare Zeichen (wie bspw. ein Anführungszeichen „ in ISO-8859-1) escapet werden („ bspw. als „. Der XML/HTML-Prozessor löst die Escapes wieder zu den Unicode-Zeichen auf.

🖖 Живіть довго і процвітайте

--
When the power of love overcomes the love of power the world will know peace.
— Jimi Hendrix
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar

Ihre Identität in einem Cookie zu speichern erlaubt es Ihnen, Ihre Beiträge zu editieren. Außerdem müssen Sie dann bei neuen Beiträgen nicht mehr die Felder Name, E-Mail und Homepage ausfüllen.

abbrechen