Guten Morgen Dirk,
mit zu php kann ich nichts sagen, jedoch zum Zeichensatz:
Da ich meine Seiten in deutsch und russisch ausliefere, bin ich vor einem ähnlichen Problem gestanden. Ich verwende für die Dekodierung utf-8. Dementsprechend habe ich in meinen Dateien im xml-Vorspann
<?xml version="1.0" encoding="UTF-8"?> und im Kopf <meta http-equiv="Content-Type" content="application/xhtml+xml; charset=utf-8" ></meta> stehen. Wichtig ist natürlich, dass der Server dann auch utf-8 ausliefert; beispielsweise eim Apache-Sever mit einem Eintrag in der .htaccess-Datei "AddCharset utf-8 .html".
Die Texte vom Worddokument in die html/xhtml-Datei zu kopieren sollte ja kein Problem sein. Voraussetzung ist natürlich, dass der Editor die utf-8-Dekodierung beherrscht.
Mit Gruß
Dada