Patrik: Word zu HTML konvertieren

Hoi zäme

Im Zusammenhang mit HTML-Help müssen wir bestehende Word97 Dokumente ins HTML Format konvertieren.

Ich habe mich auch schon im Archiv schlau gemacht und gesehen, dass es einige Tools gibt. Selbst habe ich schon mit Word2000 und dem Update-Tool konvertiert - mit zufriedenstellendem Ergebnis.

Die letzte Diskussion ist nun aber schon wieder länger her und ich möchte wissen, ob mit jemand Zwischenzeitlich  neues weiss und noch Tipps geben könnte, wie man Word Dokumente am einfachsten ins HTML konvertiert.

Etwas weniger wichtig, da es nicht im Intra-Internet verwendet wird, die erzeugte Dateigrösse. Wichtiger aber, eine möglichst 1:1 umsetzung.

Vielen Dank für Anregungen, Meinungen und Tipps
Patrik

  1. Hi Patrik,

    ich weiß nicht, ob es bei Dir drum geht, das Layout in HTML zu übersetzen, oder nur den Inhalt möglichst leicht rüberzukriegen.
    Bei mir geht es immer um das zweite, und ich mache das mit Hilfe eines Word-Makros. Das kodiert im Wesentlichen Umlaute und Sonderzeichen, bei Bedarf häng ich noch was dran, was die Word-Steuerzeichen für z.B. Schriftauszeichnung oder Absätze durch HTML ersetzt.
    Funzt alles auch "Suchen und ersetzen"-Basis und tut ganz prima das, was es soll (hab's ja auch selber gemacht :-), und wenn das Makro über den Text drüber ist, kommt alles per Copy & Paste in die HTML-Vorlage.

    Grüße,

    Utz

    1. Hoi Utz

      Danke für die Antwort!

      ich weiß nicht, ob es bei Dir drum geht, das Layout in HTML zu übersetzen, oder nur den Inhalt möglichst leicht rüberzukriegen.

      Da es ein Hilfesystem wird, kommt es schon am meisten aufs Layout drauf an. Insbesondere Screenshots (Grafiken) kommen häufig vor und dürfen beim konvertieren ins HTML im Layout nicht beeinträchtigt werden.

      Dazu kommt noch, dass wir eher im grossen Stil konvertieren müssen. Das Tool sollte demzufolge Batch-Möglichkeiten aufweisen.

      Rein gefühlsmässig denke ich dass die Variante mit Macro etc. nicht für unser Unterfangen geeigent ist.

      Patrik

      1. Hi Patrik,

        Rein gefühlsmässig denke ich dass die Variante mit Macro etc. nicht für unser Unterfangen geeigent ist.

        Da hast Du völlig recht, weil Bilder kriegt man auf die Art und Weise nicht rüber.

        Grüße,

        Utz

        1. Hi Patrick,

          in der aktuellen c't (Heft 9/2000) gibt's mehrere Artikel zum Theme Office 2000, davon einen auch genau zu Deinem Problem (Umwandlung von Office-Dokumenten nach HTML).

          Fazit ist da nach meiner Erinnerung, dass im Intranet mit reiner MS-Umgebung (IE5) ganz brauchbare Ergebnisse moeglich sind. Mit anderen Browsern gibt's da wohl eher Schwierigkeiten, aber ganz ohne Probleme geht's auch mit dem IE nicht.

          Wenn Du die c't nicht hast, lohnt sich vielleicht ein Gang zum naechsten Kiosk - zumindest kannst Du da mal reingucken, ob's Dir hilft (ich hoffe, es gibt die c't auch in der Schweiz ;-).

          (Von Tools zur Batch-Konvertierung stand da aber glaub ich nichts.)

          Bis dann,
          Heiko

  2. Hallo Patrik

    Im Zusammenhang mit HTML-Help müssen wir bestehende Word97 Dokumente ins HTML Format konvertieren.

    Ist Dir bewußt, daß HTML Help kein reines HTML ist? Du findest mit dem Stichwort "HTML Compiler" oder "chm" einiges darüber im Archiv.

    Im übrigen fällt  mir dazu nur RoboHelp Office ein. Ich arbeite hier in der Firma damit und werde demnächst das Vergnügen haben, 2000 Topics Winhelp nach HTML zu konvertieren (nicht HTML Help, dai wir unseren Kunden kein Windows auf dem Client vorschreiben können und wollen)

    Nur Grafiken haben wir bisher ausgespart, da die unter WinHelp möglichen Formate unter HTML nicht weiterverwendet werden können.

    Grüße, Karin

    1. Hoi Karin

      Ist Dir bewußt, daß HTML Help kein reines HTML ist? Du findest mit dem Stichwort "HTML Compiler" oder "chm" einiges darüber im Archiv.

      Das ist mir schon bewusst, ich verwende Den Help-Workshop um das ganze zu kompilieren: Die Vorlagen (Quelltexte) allerdings, die sind "normales" HTML.

      Im übrigen fällt  mir dazu nur RoboHelp Office ein. Ich arbeite hier in der Firma damit und werde demnächst das Vergnügen haben, 2000 Topics Winhelp nach HTML zu konvertieren (nicht HTML Help, dai wir unseren Kunden kein Windows auf dem Client vorschreiben können und wollen)

      Da haben wir "Glück" - unsere Clients haben alle den IE installiert, somit Bahn frei für HTML Help. Eine "alte" Win-Help haben wir schon, die möchten wir eben ersetzten, müssen dabei aber nicht auf deren Word-Dokumente zurückgreifen. Das Handbuch wurde neu geschrieben und liegt nun im Word97 vormat neu vor.

      Vielen Dank für Deine Anregungen
      Patrik

  3. Hoi

    Im Zusammenhang mit HTML-Help müssen wir bestehende Word97 Dokumente ins HTML Format konvertieren.

    Installiere dir ein Staroffice,

    lade die Word97 Datei ganz normal per Doppelclick,

    gehe unter Datei auf Speichern unter

    und wähle dort speichern als HTML an,

    fertig. (Oder heisst es drin?)

    mfg Fridolin

  4. Hallo Patrick!

    Im Zusammenhang mit HTML-Help müssen wir bestehende Word97 Dokumente ins HTML Format konvertieren.
    Selbst habe ich schon mit Word2000 und dem Update-Tool konvertiert - mit zufriedenstellendem Ergebnis.

    Ich habe unlängst selbst einige Word-Dateien mit Word2000 ins HTML "konvertiert". Der Code ist einfach unglaublich grauenhaft, aber ich habe dann diese HTML-Datei unter NN3 (sic!) angeschaut und das hat mich fast vom Sessel geholt. Gut die Ganze CSS funktininiere nicht, aber der Text was genauso gegliedert, etc. wie unter IE5 und das Inklusive Fußnoten (von dem es reichlich viel im Text gab, die dann alle schön am Ende der Datei gelistet wurden, mit vor und zurück Springe-Anker.)
    Allerdings auch wenn die Konvertierung innerhalb einer Datei funktioniert, das schafft allein noch keine Hypertextumgebung, da muss man noch immer selbst Hand anlegen und dann bist du mit dem Code von Word200 konfrontiert, das ist dann eine mttlere Katastrophe, denn dort was zu ändern ist fast unmöglich, ohne daß dabei einiges "schiefgeht".
    PS: was Bilder angeht, der HTML-Help kann selbst bilder konvertieren BMP zu GIF z.B. (Qualität ist sehr schlecht leider)

    Grüße
    Thomas

    1. Hallo,

      den Code von Word 2000 kann man übrigens auch ein wenig "entschlacken", was die Darstellung im IE nicht notwendigerweise besser macht (MS-Tool: http://www.officeupdate.microsoft.com/2000/downloaddetails/msohtmf2.htm).

      Übrigens gibt es auch in der neuen C't zusätzliche Links (Demoronizer,....) für CodeTools.

      MfG

      Arno

  5. Vielen Dank für die Anregungen und Tipps!
    Patrik

    Ich werde wohl die Word97-Dokumente mit Word2000 ins HTML Format konvertieren (mit Word2000 Update).