@@Rolf B
da der Zeichensatz von XML-Dokumenten (wie auch von HTML-Dokumenten) immer Unicode ist
Sein sollte.
Nein, ist.
Zumindest habe ich schon genug XML Dokumente mit einem Einbyte Encoding gesehen
Du verwechselst Zeichensatz und Zeichencodierung.
Der Zeichensatz von XML/HTML-Dokumenten ist Unicode. Immer. Das heißt, man kann in XML/HTML-Dokumenten alle Unicode-Zeichen verwenden.
Wenn man ein XML/HTML-Dokument speichern/übertragen will, werden die Zeichen codiert (in Bytesequenzen). Bei einer Unicode-Codierung (UTF-8, UTF-16) geht das problemlos.
Bei anderen Codierungen (ASCII, ISO 8859) müssen damit nicht codierbare Zeichen (wie bspw. ein Anführungszeichen „ in ISO-8859-1) escapet werden („ bspw. als „
. Der XML/HTML-Prozessor löst die Escapes wieder zu den Unicode-Zeichen auf.
🖖 Живіть довго і процвітайте
When the power of love overcomes the love of power the world will know peace.
— Jimi Hendrix