Hallo,
ich suche ein script in php (bevorzugt) oder perl, oder jemanden, der mir so etwas schreiben kann (preis vb), welches word-dokumente in xml wandelt. die word dokumente sind generell in einem speziellen schema gehalten (überschrift, kopf- und fußnoten, tabellen, bilder, etc.).
1. Probiere es mit Word 2003 und dem Speichern im XML-basierten WordML-Format [*].
2. Es bieten sich u. a. diese Alternativen: mediaTEXT XML Writer oder qad_doc2xml.
[*] BTW zum Thema WordML:
Die Internet Professionell 12/2004 enthaelt einen Artikel von Markus Schraudolph zur Umwandlung von WordML mit PHP 5 und SimpleXML-Methoden nach HTML (Beispielcode).
Unter http://www.datenverdrahten.de/xslt/wordml/artikel_1.xsl
bzw. http://www.datenverdrahten.de/xslt/wordml/artikel_2.xsl
sind meine Versuche zur Umsetzung des WordML-Beispiels mit XSLT zu finden. Die erste Vorlage arbeitet mit xsl:for-each-Konstrukten, die zweite mit mehreren xsl:template-Definitionen und xsl:apply-templates-Aufrufen.
MfG, Thomas