wunderwarzenschwein: Word-HTML säubern

Hi,

da ich öfters gezwungen bin, Word-Dokumente ins Web zu stellen, suche ich nach einem Tool, das Words-Pseudo-HTML-XML-Brei etwas aufräumt, entschlackt und auch in Nicht-IE-Browsern darstellbar macht.
IIRC gab es mal ein Perlskript, das die sache für W95 oder 97 gemacht hat.

Weiß da jemand was brauchbares?

TIA

wunderwarzenschwein

  1. Hi,

    da ich öfters gezwungen bin, Word-Dokumente ins Web zu stellen, suche ich nach einem Tool, das Words-Pseudo-HTML-XML-Brei etwas aufräumt, entschlackt und auch in Nicht-IE-Browsern darstellbar macht.

    HTML-Tidy: http://tidy.sourceforge.net/

    IIRC gab es mal ein Perlskript, das die sache für W95 oder 97 gemacht hat.

    Ich bin mir jetzt nicht ganz sicher, ob http://sourceforge.net/projects/ptidy bereits eine große Hilfe ist ;)

    Ich habe Tidy in HTML-Kit eingebunden (http://chami.com/html-kit/). Auf der oben genannten Seite gibt's allerdings haufenweise Links - sieh dich mal etwas um, vielleicht findest du ja etwas brauchbares.

    LG Orlando

    --
    SELF-TREFFEN 2002
    http://www.rtbg.de/selftreffen/
    http://www.megpalffy.org/temp/penneninhh.html

    1. Selber Hi,

      sonst stell doch gleich das Word-Document ins Netz. Wenn Du die Fonts einbettest, kann noch nicht mal mehr verändert werden (mit Word). Da es auf Linux-Rechnern inzwischen zu hauf Staroffice gibt, können die das auch öffnen.

      LG

      Chris

      1. Hai Chris,

        sonst stell doch gleich das Word-Document ins Netz.

        das ist aber was ganz anderes, denn dann gibt's erst mal einen download, der Besucher muss dann sein Office starten, um das Textdokument zu öffnen.

        Wenn ich die Vorgehensweise richtig verstanden habe, soll der Besucher die Datei direkt im Browser lesen können, und dafür ist IMHO eine Word-datei ungeeignet. Ein klein wenig besser wäre es, die Datei als PDF zur Verfügung zu stellen, da gibt's u.U. passende Plug-ins o.ä.

        1. Hai Chris,

          sonst stell doch gleich das Word-Document ins Netz.

          das ist aber was ganz anderes, denn dann gibt's erst mal einen download, der Besucher muss dann sein Office starten, um das Textdokument zu öffnen.

          Wenn ich die Vorgehensweise richtig verstanden habe, soll der Besucher die Datei direkt im Browser lesen können, und dafür ist IMHO eine Word-datei ungeeignet. Ein klein wenig besser wäre es, die Datei als PDF zur Verfügung zu stellen, da gibt's u.U. passende Plug-ins o.ä.

          Irrtum vom Leser.

          Ich stell Dir mal ein Word-Dokument ins Netz unter

          http://szene-bs.de/admin/infoFolder.doc Achtung, 1,7MB

          Aber das ist bei umfangreichen PDFs auch nicht besser

          Hast Du ein Windows-System, dann klick mal auf den Link. Sonst kannst Du es lassen. Aber 90% der User haben einen Windows-Client mit Office. 85% haben IE. Nur 50% haben PDF-Reader.

          Deine Meinung würde mich interessieren.

          Gruß

          Tom

  2. Hallo,

    meines Wissens nach gibt's in Dreamweaver eine extra Funktion "Word-HTML optimieren...", die diese Arbeit ganz gut tut.

    Grüße aus Würzburg
    Julian

  3. Hallo,

    von Microsoft gibt es ein spezielles Tool mit dem man auf Word-Dateien HTML-Dateien mit sauberen HTML machen kann.
    Meine Erfahrungen damit sind sehr gut.

    Leider hab ich kein Link parat. Aber mit den Stichworten "HTML" und "Word" sollte man auf der Microsoft-Homepage relativ schnell fündig werden.

    Gruss
       MichaelB