Christian S.: Mit reg. Ausdrücken XML parsen + CDATA berücksichtigen

Beitrag lesen

Hallo,

ich möchte mit regulären Ausdrücken eine XML Datei auswerten.

Innerhalb des XMLs möchte ich z.B. alle Element "XXX" finden die ein Attribut "YYY" haben.

Der regüläre Ausdruck dafür ist ja nicht weiter schwer.

Allerdings kann das XML auch ein Scriptelement haben, welches Scriptcode beinhaltet.

Das Scriptelement ist mit <![CDATA[     ]]> gekennzeichnet.

Auf diese Zeichenfolge kann man sicher auch prüfen, ich frage mich allerdings wie ich es anstelle, wenn das Dokument z.B. so aussieht:

<script>  
<![CDATA[  
   var a = "]]>";  
   var b = "]]></script>";  
   var c = '<element attr="123" />';  
]]>  
</script>  
<element attr="123" />

Was ich finden möchte ist hoffentlich klar: Nur das Element namens element.

Doch wie parse ich das Dokument am besten (mit Hilfe regulärer Ausdrücke), um nicht mit dem Inhalt des Scriptelements durcheinander zu kommen.

Gruß!