Pummel: Zeichen außerhalb ASCII in benannte HTML-Zeichen umwandeln

Beitrag lesen

Hallo,

ich hätte gerne, daß in einem aus einem XML-Dokument erstellten HTML-Dokument die benannten HTML-Zeichen verwendet werden. Die Angabe € kennt der XML-Parser nicht, gebe ich direkt  ein, wird daraus €. Warum das beides so ist, ist mir klar, ich will auch nicht sagen, daß das theoretisch falsch wäre, ich hätte lediglich gerne, daß er € ausgibt (selbiges natürlich auch für alle anderen Basiszeichen, also Umlaute und dergleichen).

Am praktischsten wäre es, wenn ich in XML direkt  tippen könnte, aber wenn es denn umbedingt sein muß, wäre ich auch mit der Eingabe € zufrieden. Aber selbst das konnte ich dem XML-Parser irgendwie nicht beibringen, die Angabe <!ENTITY euro "€"> im DTD quitiert er mir mit einer Rekursion, "&euro;" gibt er hingegen wiederum 1:1 aus.
Und davon mal abgesehen habe ich eigentlich keine Lust, den ganzen Müll jedesmal selbst definieren oder importieren zu müssen.

Ausprobiert habe ich bislang saxon (gruselig) und derzeit sablotron (macht zumindest schonmal vernünftige Zeichensatzkonvertierung, verlangt aber die Angabe der XSL-Datei auf der Kommadozeile, obwohl sie mit <?xml-stylesheet> angegeben ist).

Bin ja mal gespannt, ob sich hier jemand damit auskennt, ansonsten geht's hier wohl eher um triviales Geplänkel :>

Einen schönen Tag noch!