Thomas J.S.: XML: Texte aus dem content extrahieren?

Beitrag lesen

Hallo,

leider habe ich über die Suche keine Hilfe gefunden.
Ich habe recht umfangreiche XML-Dateien die Texte für eine Webseite enthalten und händisch geschrieben sind.
Ich muss jetzt aus den Dateien nur die Texte extrahieren. So dass keine Tags und Sonderzeichen mehr vorhanden sind.
Gibt es dafür ein kostenloses Tool oder eine andere Möglichkeit ausser "Suchen und ersetzen"?

Du kannst es mit XSLT lösen, es kommt darauf an was/wie genau das Ergebnis aussehen muss (ob du auch die Inhalte der Attribute brauchst, ob du Zeilenumbrüche etc. brauchst.

Es reicht u.U. ein einfaches XSL-Datei auf dein XML-anzuwenden:
---------
<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="text" encoding="UTF-8" />
    <xsl:template match="*">
   <xsl:value-of select="." />
  xsl:text&#xA;&#xD;</xsl:text>
    </xsl:template>
</xsl:stylesheet>
----------

Grüße
Thomas