Hallo.
Die beiden Programme kannte ich bisher nicht, an RTF hatte ich auch bisher noch nicht gedacht.
Ich bin im Rahmen eines CMS-Projektes damit in Berührung gekommen und fand es allemal praktischer als den direkten Export aus Word heraus. Tidy sollte man aber eigentlich kennen, wobei es in viele Editoren integriert ist, womit sich eine gesonderte Installation erübrigt. Naja, außerdem sieht HTML-Code heute ja meist ohnehin schon besser aus als noch vor wenigen Jahren, und auf Einrückungen oder Leerzeilen verzichtet heute auch sicher kaum noch jemand wegen der geringeren Datenmenge. Aber beim Word-Export weiß man ja nie.
Wollte eben nur sichergehen, dass ich dann dem richtigen Pfad folge bzw. den Ansatz kapiere. Auch wenn der "safe mode" eigentlich "missbraucht" wird, habe ich ihn auf dem virtuellen Server erstmal so gelassen, wie voreingestellt, nämlich auch "on". Somit erübrigt sich shell_exec() erstmal so direkt in jedem directory. Übers cgi-bin ließe sich dann was machen. Oder den safe_mode() für ein bestimmtes Verzeichnis/Vhost ausschalten u.U.. Das wollt ich nur im Hinterkopf haben.
Ja, stimmt, keine Sicherheitslücken aufreißen. Darauf hätte ich hinweisen sollen, aber du bist ja schließlich vom Fach und schaltest im Fragemodus nicht einfach den Kopf ab.
Und dann eben erstmal schauen, was beim Word-Export, durch UnRTF und tidy geschleust am Ende herauskommt.
Regelrechte Wunder sind sicher nicht zu erwarten, aber für die meisten Dokumente sollte es genügen und vor allem recht schlanken und sauberen Code produzieren.
MfG, at