Julian Hofmann: Word-Dokument in HTML konvertieren. Was eignet sich?

Hallo,

für einen Bekannten soll ich eine umfangreichere Arbeit (über 200 Seiten) zu einer Homepage zusammenbasteln. Der Text liegt in Form von Worddokumenten vor, jedoch scheint mir die Konvertierung durch Word 2000 aussichtlos bzw. unansehlich.
Kann mir jemand ein (günstiges) Programm empfehlen, das Word-Dokumente besser in HTML umwandelt?

Danke schon jetzt.

Grüße aus Bayreuth
   Julian

  1. Kann mir jemand ein (günstiges) Programm empfehlen, das Word-Dokumente besser in HTML umwandelt?

    Hi Julian,
    kurze Suche im Forums-Archiv (nacj meinem eigenen beitrag) - und:

    <../../sfarchiv/1999_3/t06499.htm#a31645>

    MfG
    Detlef

    1. Hallo Detlef,

      kurze Suche im Forums-Archiv (nacj meinem eigenen beitrag) - und:

      Tja, Suchmaschinen muß man wohl leider auch richtig Füttern. Meinen Suchanfragen brachten nämlich keine befriedigenden Ergebnisse.
      Auf jeden Fall danke für den Hinweis.

      Gruß
      Julian

      1. Hi Julian!

        Wenn es sich um eine einfach gestrickte Word-Datei handelt, dann gibt es kaum was besseres als Word 2000. Der Nachteil von Word 2000 ist jedoch, dass der einen irrsinnig großen Quelltext aufbaut. Daher eignet sich sowas eher fürs Intranet, als fürs Internet. Es soll zwar bei Microsoft ein Toll zu runterladen geben, welches den Quelltext kleiner hält, aber wie klein er dann wird, weiß ich nicht. Bei komplexen Dateien mit viel Tabellen, Textfeldern etc. kannste das auch vergessen.

        Viel Erfolg!
        Markus

        1. Der Nachteil von Word 2000 ist jedoch, dass der einen irrsinnig großen Quelltext aufbaut. Daher eignet sich sowas eher fürs Intranet, als fürs Internet. Es soll zwar bei Microsoft ein Toll zu runterladen geben, welches den Quelltext kleiner hält, aber wie klein er dann wird, weiß ich nicht. Bei komplexen Dateien mit viel Tabellen, Textfeldern etc. kannste das auch vergessen.

          Wenn man sich so einen generierten Quelltext ansieht, dann wird man erkennen, daß bestimmte Dinge immer wieder generiert werden (beispielsweise Angaben zu Schriften usw.).
          Wenn man etwa weiß, daß man sein HTML-Dokument ohne Schriftangaben machen will, dann kann man mit einem Filter (Perl-Skript etc.) oder einem guten programmierbaren Editor einiges bewirken.

          Die Kandidaten, wo Generatoren meiner Meinung nach schlecht sind, sind diejenigen, wo Konzepte nicht hinreichend kompatibel sind. Generatoren tendieren dazu, bei Schriftangaben sehr geschwätzig zu sein (daß es in HTML eine Defaultschrift gibt, kann man Word schlecht begreiflich machen) und bei Tabellen wahnsinnig exakte Größenangaben zu machen (auch wenn man eine einfach nur logisch ge-tag-te Tabelle im Browser sehr schön ansehen könnte.
          Also: Suchen und Ersetzen nach <FONT> und <TD> mit geeigneten Attributen; ein Editor mit regular expressions kann hier sehr hilfreich sein.

          Was ein solcher Editor natürlich nicht leisten kann, ist die Umsetzung eines monolithischen Word-Dokuments in ein Web aus vielen kleinen HTML-Seiten mit schöner Navigation ...

          1. Was ein solcher Editor natürlich nicht leisten kann, ist die Umsetzung eines monolithischen Word-Dokuments in ein Web aus vielen kleinen HTML-Seiten mit schöner Navigation ...

            und genau dafür gibt es im großen weiten web auch eine lösung:
            such mal in yahoo nach "MindManager".
            mfg
            detlef