Axel Richter: XML PHP Entities Umlaute echo save

Beitrag lesen

Hallo,

Ein:

<?xml version="1.0" encoding="ISO-8859-1"?>
<wurzel>
&gt;Ü
</wurzel>

wäre einen Versuch wert, eventuell verbunden mit einem
$doc=new DOMDocument('1.0', 'iso-8859-1');.

Dann erhalte ich :

<?xml version="1.0" encoding="ISO-8859-1"?>
<wurzel>
&gt;Ü
</wurzel>

Ü

Aha, $doc->documentElement->nodeValue liefert also UTF-8 zurück. Das ist nicht wirklich überraschend, wo doch UTF-8 das Standard-encoding für XML ist.

<?xml version="1.0" encoding="ISO-8859-1"?>
<wurzel>
&gt;Ü
</wurzel>

also als nodeValue ">Ü",

Ja, ein "Ü" in UTF-8 im Browser als zwei Zeichen in ISO-8859-1 dargestellt. Stelle den Browser auf UTF-8, dann siehst Du ein Ü.

in dem Fall auch den Editor auf 8-Bit umgestellt.

Bitte? Heißt das vorher war der Quellcode-Text UFT-8 gespeichert? Dann ist das Ergebnis aber nicht erklärbar. Oder hieß das andere im Editor einfach Unicode? Das wäre dann UTF-16 oder ISO-10646-UCS-2.

Wenn Dein Editor UTF-8 speichern kann, dann wäre das konsequente Nutzen von UTF-8 wohl das Beste. Andererseits, wobei denkst Du würden Dich die numerischen Zeichenreferenzen, wie &#xDC; oder &#220; denn stören?

viele Grüße

Axel