venty: PHP + XML + Umlaute

Beitrag lesen

Hallo,

habe hier eine XML Datei die regelmäßig aktualisiert wird und eingelesen werden soll. Diese kann 300 MB oder noch größer sein, daher kann ich nur den XML Parser und nicht simplexml verwenden.

Die XML enthält Umlaute die mir zu schaffen machen. Die Daten in der XML sollen eigentlich in die DB gespeichert werden aber zum testen will ich sie erst mal ausgeben.

Die XML Datei sollte eigentlich in UTF-8 sein.
<?xml version="1.0" encoding="UTF-8"?>

Auch der Parser ist auf UTF-8 gestellt (2 mal)

// creating parser object  
        $xml_parser = xml_parser_create('UTF-8');  
  
        // set encoding to UTF-8  
        xml_parser_set_option($xml_parser,  
                XML_OPTION_TARGET_ENCODING,  
                'UTF-8');

Trotzdem wird die Ausgabe der Funktion ...

function contents($parser, $data) {  
  
        // entferne störende zeichen  
        // $data = htmlentities($data);  
  
        echo $this->element.':        ';  
        echo $data;  
        echo "<br />";  
        $this->i++;  
  
        if ($this->i >= 100) die($this->i);  
    }

... bei jedem & Zeichen abgebrochen bzw geteilt. Beispiel:

destinationdescription: Die "Perle der Krim" z
destinationdescription: ählt zu den beliebtesten

Wenn ich selbst auf google suche wird immer auf die Codierung verweisen aber da ich diese 3 mal in UTF-8 habe sollte das Problem wo anders liegeb (oder?)

Wenn euch eine Info fehlt einfach sagen.
Hoffentlich könnt ihr mir helfen!

LG Venty