Michael Schröpl: «horror»text.doc -» text,html«/horror» geht das besser

Beitrag lesen

ich habe gerade versucht aus einem worddokument eine html seite zu generieren, mir ist immer noch schlecht.

Kann ich verstehen.

gibt es irgendein programm das *.doc files in html umwandelt ohne sie zu entstellen??

Kommt darauf an, was Du erwartest. Im strengen Sinne (also sagen wir mal: HTML 4.0) muß ich Deine Frage mit "nein" beantworten.

Das liegt aber nicht an konktret existierender Konverter-Software, sondern an der Natur der Sache: Die Konzepte beider Universen sind einfach zu inkompatibel zueinander.

  • Word kennt Tabulatoren, HTML nicht - dort müßte man entsprechende Effekte irgendwie simulieren.
  • HTML denkt in einem grenzenlosen Universum, Word kennt DIN-Formate und Tabellenbreiten in Maßeinheiten.
  • Word glaubt, Schriftarten selbst definieren zu müssen, HTML weiß, daß der Benutzer sinnvolle Defaults in seinem Browser einstellen kann.
  • ...

Man darf einfach nicht erwarten, daß eine Word-Datei sich automatisch nach HTML (und damit meine ich *nicht* XML mit Microsoft-Erweiterungen!) konvertieren läßt, ohne dabei erheblich an Qualität zu verlieren bzw. "schlechten" HTML-Code zu verwenden.
Nach meiner Erfahrung läßt sich eine aus Word automatisch generierte HTML-Datei um etwa 50% in ihrer Größe reduzieren und sieht danach auch noch wesentlich "webiger" aus.