Hallo.
a) leider sind in der jetzt zum testen abgespeicherten Variante xml-Namespaces vorhanden. Vielleicht gibts ja noch eine andere Möglichkeit unter Word das abzuspeichern.
Exportiere doch ein RTF, das du anschließend mittels UnRTF in HTML wandelst und mittels Tidy verschlankst.
b) Konflikte mit dem vorhandenen Style müssen beseitigt werden
Suche im Quellcode des konvertierten Dokumentes nach Klassen- und ID-Bezeichnungen, um ihnen einen definierten Präfix voranzustellen. Und Inline-Styles sind ja zwar nicht eben elegant, aber zumindest unkritisch.
c) man muss hoffen, dass in einem neuen Dokument nicht neue MSO-Styles auftreten, die nicht ins externe ausgelagert wurden.
Die verwendeten Werkzeuge werden gut gepflegt und sollten solchen Unwägbarkeiten gewachsen sein. Außerdem ist RTF so gut dokumentiert, dass sogar Microsoft selbst den Export hinbekommen sollte.
MfG, at