Axel: OpenOffice Dokument in html konvertieren

Hallo,

gibt es bei Cpan oder sonst wo eine nützliche Bibliothek, mit der man ein OpenOffice-Textdokument in html verwandeln kann? Oder muss ich das alles selber schreiben? Rein theoretisch muss es ja einigermaßen gut machbar sein, da OpenOffice ja das XML-Format verwendet.

Für jede Hilfe dankbar! Axel

  1. Hi there,

    Rein theoretisch muss es ja einigermaßen gut machbar sein, da OpenOffice ja das XML-Format verwendet.

    Vorsicht! OOo verwendet gezipptes xml. Ausserdem hat OpenOffice bereits ein Funktion eingabaut, die Dir beim Speichern die Möglichkeit zu html-Ausgabe gibt. Die ist halt wie beim automatisierten Html immer ziemlich bescheiden...

    1. Hi there,

      Rein theoretisch muss es ja einigermaßen gut machbar sein, da OpenOffice ja das XML-Format verwendet.

      Vorsicht! OOo verwendet gezipptes xml. Ausserdem hat OpenOffice bereits ein Funktion eingabaut, die Dir beim Speichern die Möglichkeit zu html-Ausgabe gibt. Die ist halt wie beim automatisierten Html immer ziemlich bescheiden...

      Ich weiß, aber das mit dem Zippen lässt sich ja lösen. Es gibt ja auch die Bibliothek OpenOffice::OODoc, etc.

      Aber ich habe dort keine Bibliothek zum konvertieren nach html gefunden. Und ich möchte eben gerade den Weg umgehen, das Dokument per Hand als html-Datei abzuspeichern.

      1. Moin,

        Aber ich habe dort keine Bibliothek zum konvertieren nach html gefunden. Und ich möchte eben gerade den Weg umgehen, das Dokument per Hand als html-Datei abzuspeichern.

        Dein Freund heisst XSLT. Nachdem du das XML-Dokument aus der .swx-Datei gezogen hast (wie auch immer), musst du es mit einem Stylesheet deiner Wahl in ein HTML-Format deiner Wahl transformieren. Nichts anderes macht auch OOo beim Export nach HTML oder DocBook-XML, auch wenn der original HTML Export unverständlicherweise recht schäbig ist.

        Du kannst so ein XLST auch gleich lokal "installieren" und OOo dazu bringen sein (internes) XML-Dokument mit diesem XSLT zu verheiraten um "irgendein" HTML-Dokument daraus zu erstellen bzw. zu exportieren.

        Viel Spaß,
        CirTap

  2. gibt es bei Cpan oder sonst wo eine nützliche Bibliothek, mit der man ein OpenOffice-Textdokument in html verwandeln kann? Oder muss ich das alles selber schreiben? Rein theoretisch muss es ja einigermaßen gut machbar sein, da OpenOffice ja das XML-Format verwendet.

    Cpan hat durchaus eine Suchfunktion.
    Gefunden habe ich nur das
    http://search.cpan.org/dist/OpenOffice-OODoc/

    Scheint aber keine Konvertierung anzubieten.

    Struppi.