Encoder: mehrere xml Dateien im Word Format zusammenführen

Hallo ihr

Ich hab hier ca. 100 *.xml Dateien im Word Format. Also kein docx oder so, reines xml.
Diese Dateien muss ich zu einer einzigen zusammenführen.
Ich habe allerdings kein Word und möchte bzw. kann auch keine Word-Klassen in einer bestimmten Sprache einbinden. Bin also auf reine Stringverarbeitung angewiesen. Wär cool wenn mir da jemand weiterhelfen könnte.

Bisheriger Ansatz: ich habe die wx:sect Abschnitte aus den Dateien extrahiert und sie in einer Datei alle aneinander gehängt. Da kommt schon mal was ansatzweise brauchbares raus. Die Inhalte stehen dabei direkt hintereinander, was jetzt fehlt wär eigentlich nur noch ein Seitenumbruch.
Wie krieg ich den da rein? Kanns leider nicht ausprobieren, da kein Word. Nur WordViewer.
Oder gibts was noch besseres als meine Idee?

  1. hi,

    Oder gibts was noch besseres als meine Idee?

    Einfach aneinanderhängen!? Bedenke: Jede XML-Datei präsentiert eine in sich geschlossene Datenstuktur. Ich würde mir einen Parser schnappen und mir das erstmal angucken, damit ich weiß, was ich daraus machen könnte. Basis für eine mögliche Zusammenführung ist die Datenstruktur, nicht die Verpackung (XML).

    Hotti

    1. Einfach aneinanderhängen!?

      Alles aneinanderhängen ist nicht gut. Das wäre verglichen mit einem HTML Dokument dann sowas
      <?DOCTYPE ...>
      <html>
      <head> ... </head>
      <body> ... </body>
      </html>
      <?DOCTYPE ...>
      <html>
      <head> ... </head>
      <body> ... </body>
      </html>
      usw. in einem einzigen Dokument.
      Was ich machen will ist praktisch den Inhalt von <body> aneinander hängen (Vergleich!) und dazwischen einen Seitenumbruch. Nur kenne ich mich mit dem Aufbau der Dateien nicht aus und ich finde nichts drüber was ich da wirklich wohin hängen muss.

  2. Hallo Encoder,

    Bisheriger Ansatz: ich habe die wx:sect Abschnitte aus den Dateien extrahiert und sie in einer Datei alle aneinander gehängt. Da kommt schon mal was ansatzweise brauchbares raus. Die Inhalte stehen dabei direkt hintereinander, was jetzt fehlt wär eigentlich nur noch ein Seitenumbruch.

    Das (leere) Element w:br mit Attribut w:type="page" sollte helfen. Weitere Informationen liefert dieses Tutorial mit Elementreferenz.

    Grüße,
    Thomas

    1. Cool, genau danach hab ich gesucht. Danke dir!