maroone: XML: Texte aus dem content extrahieren?

Hallo zusammen,

leider habe ich über die Suche keine Hilfe gefunden.
Ich habe recht umfangreiche XML-Dateien die Texte für eine Webseite enthalten und händisch geschrieben sind.
Ich muss jetzt aus den Dateien nur die Texte extrahieren. So dass keine Tags und Sonderzeichen mehr vorhanden sind.
Gibt es dafür ein kostenloses Tool oder eine andere Möglichkeit ausser "Suchen und ersetzen"?

Die XML-Datei sieht z.B. so aus:

<fliesstext>Blindttext zu den Prüfständen an den internationalen Standorten. Über die Weltkarte einen Standort mit Prüfstand auswählen.\nSie erhalten eine Übersicht für welchen Zeitraum ein Prüfstand mit welcher Prüfserie belegt ist und können diesen Prüfstand für Ihre Versuchsreihe buchen bzw. reservieren.</fliesstext>
   <pruefstand>Prüfstand</pruefstand>
   <orte>
    <ort id="1" ort="Plymouth" head="Test Department Plymouth, Michigan USA" content="Test centre focused on engine mounts and suspension bushes. Specialists for Specialists for multi axle durability tests  and NVH measurements">
     <machine id="1" name="Electrodynamic shaker">
      <content head="machine no." content="VNA1" />
      <content head="manufacture:" content="LDS Dactron" />
      <content head="working range:" content="Max Frequency: 5000 Hz\nMax Displacement:± 12.5 mm" />
      <content head="features:" content="Temperature chamber (-130°C to 210°C)" />
      <image>
       <image src="pop_plm_01_1.jpg" />
      </image>
     </machine>

Bin für jede konstruktive Hilfe dankbar!

Schöne Grüße
maroone

  1. Hallo,

    leider habe ich über die Suche keine Hilfe gefunden.
    Ich habe recht umfangreiche XML-Dateien die Texte für eine Webseite enthalten und händisch geschrieben sind.
    Ich muss jetzt aus den Dateien nur die Texte extrahieren. So dass keine Tags und Sonderzeichen mehr vorhanden sind.
    Gibt es dafür ein kostenloses Tool oder eine andere Möglichkeit ausser "Suchen und ersetzen"?

    Du kannst es mit XSLT lösen, es kommt darauf an was/wie genau das Ergebnis aussehen muss (ob du auch die Inhalte der Attribute brauchst, ob du Zeilenumbrüche etc. brauchst.

    Es reicht u.U. ein einfaches XSL-Datei auf dein XML-anzuwenden:
    ---------
    <?xml version="1.0" encoding="utf-8"?>
    <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
        <xsl:output method="text" encoding="UTF-8" />
        <xsl:template match="*">
       <xsl:value-of select="." />
      xsl:text&#xA;&#xD;</xsl:text>
        </xsl:template>
    </xsl:stylesheet>
    ----------

    Grüße
    Thomas