frankx: Word->html - Dokument einbinden

Hellihello

auf einer Webseite soll ein aktueller Teil ("newsletter") vom Betreiber austauschbar sein.

Word spuckt ja immerhin xhtml aus, dass von allen neueren Browsern lesbar scheint. Insofern ließe sich das, auch wenn es im Style 250 Zeilen xml-Deklarationen und CSS-Anweisungen hat, ja direkt einbinden.

Variante 1.) mit <object>.
a) Leider ist es dann nicht möglich, sich versteckt in die Seitenstruktur (zweispaltiges Layout from selfhtml) einzuschmiegen, weil es eine Höhe braucht. Und "Rest der Seite" gibts ja nicht.
b) Leider bringen die modernen Browser dann einen horizontalen Scrollbalken mit in bisschen scrollbarem nach rechts. MS-Brause macht das nicht.

Variante 2.) <iframe> ist wohl das selbe wie Variante 1.

Variante 3.) Die eingebetteten Stylangaben in ein externes Stylesheet verbannen, per PHP den Body auslesen und ins Dokument verpflanzen.
a) leider sind in der jetzt zum testen abgespeicherten Variante xml-Namespaces vorhanden. Vielleicht gibts ja noch eine andere Möglichkeit unter Word das abzuspeichern.
b) Konflikte mit dem vorhandenen Style müssen beseitigt werden
c) man muss hoffen, dass in einem neuen Dokument nicht neue MSO-Styles auftreten, die nicht ins externe ausgelagert wurden.

Hätte jemand eine Idee dazu?  KISS (keep it simple stupid) wäre schön (;-). Dazu gehört, dass der Newsletter seit jeher in Word erstellt und per Copy-Paste via Outlook versandt wird. Und eben eine Kopie davon soll monatlich ins Netz auf die Website.

Dank und Gruß,

frankx

--
tryin to multitain  - Globus = Planet != Welt
  1. Hi!

    Plain Text.

    1. Hellihello

      Plain Text.+

      No.

      Dank und Gruß,

      frankx

      --
      tryin to multitain  - Globus = Planet != Welt
  2. Hallo Robert,

    Hätte jemand eine Idee dazu?  KISS (keep it simple

    einfacher Text, den Du bereits abgelehnt hast, was

    stupid

    ist. [1]

    ) wäre schön (;-). Dazu gehört, dass der Newsletter seit jeher in Word erstellt und per Copy-Paste via Outlook versandt wird. Und eben eine Kopie davon soll monatlich ins Netz auf die Website.

    Copy & Paste in TinyMCE, siehe Beispiel mit Word-Zwischenablage-Symbol oder etwas vergleichbares.

    Freundliche Grüße

    Vinzenz

    [1] Ich vermute zu Deinen Gunsten, dass es nicht in Deiner Entscheidungsbefugnis liegt.

    1. Hellihello  Vinezenz,

      Hätte jemand eine Idee dazu?  KISS (keep it simple

      einfacher Text, den Du bereits abgelehnt hast, was

      stupid

      ist. [1]

      Nun, ich sehe das genauso wie der bedürftige erstmal in diesem Fall, auch wenn [1] sonst auch noch greifen würde.

      Der Newsletter ist schon recht minimalistisch, doch enthält er eine Menge Infos zu verschiednen Themen, enthält Links und Terminlisten, wäre also ohne Überschriften, Absätze, Tabs/Tabellen, Anker nicht wirklich brauchbar bzw. würde doch dramatisch an usability verlieren, die ja zT. auch vom Layout abhängig ist.

      Copy & Paste in TinyMCE, siehe Beispiel mit Word-Zwischenablage-Symbol oder etwas vergleichbares.

      Danky. Checkichma.

      Dank und Gruß,

      Robert aka
      frankx

      --
      tryin to multitain  - Globus = Planet != Welt
  3. Hallo.

    a) leider sind in der jetzt zum testen abgespeicherten Variante xml-Namespaces vorhanden. Vielleicht gibts ja noch eine andere Möglichkeit unter Word das abzuspeichern.

    Exportiere doch ein RTF, das du anschließend mittels UnRTF in HTML wandelst und mittels Tidy verschlankst.

    b) Konflikte mit dem vorhandenen Style müssen beseitigt werden

    Suche im Quellcode des konvertierten Dokumentes nach Klassen- und ID-Bezeichnungen, um ihnen einen definierten Präfix voranzustellen. Und Inline-Styles sind ja zwar nicht eben elegant, aber zumindest unkritisch.

    c) man muss hoffen, dass in einem neuen Dokument nicht neue MSO-Styles auftreten, die nicht ins externe ausgelagert wurden.

    Die verwendeten Werkzeuge werden gut gepflegt und sollten solchen Unwägbarkeiten gewachsen sein. Außerdem ist RTF so gut dokumentiert, dass sogar Microsoft selbst den Export hinbekommen sollte.
    MfG, at

    1. Hellihello at,

      Hallo.

      a) leider sind in der jetzt zum testen abgespeicherten Variante xml-Namespaces vorhanden. Vielleicht gibts ja noch eine andere Möglichkeit unter Word das abzuspeichern.

      Exportiere doch ein RTF, das du anschließend mittels UnRTF in HTML wandelst und mittels Tidy verschlankst.

      UnRTF und Tidy dann via CommandLine (bzw. phps shell_exec()) ?

      Dank und Gruß,

      frankx

      --
      tryin to multitain  - Globus = Planet != Welt
      1. Hallo.

        UnRTF und Tidy dann via CommandLine (bzw. phps shell_exec()) ?

        Dachte ich zumindest. Wenn du natürlich eine bessere Idee haben solltest, wäre es nett, wenn du mit mir und dem Rest der Welt teiltest.
        MfG, at

        1. Hellihello at,

          Hallo.

          UnRTF und Tidy dann via CommandLine (bzw. phps shell_exec()) ?

          Dachte ich zumindest. Wenn du natürlich eine bessere Idee haben solltest, wäre es nett, wenn du mit mir und dem Rest der Welt teiltest.

          (;-)  - würde ich dann machen, hab ich aber nicht. Die beiden Programme kannte ich bisher nicht, an RTF hatte ich auch bisher noch nicht gedacht. Wollte eben nur sichergehen, dass ich dann dem richtigen Pfad folge bzw. den Ansatz kapiere. Auch wenn der "safe mode" eigentlich "missbraucht" wird, habe ich ihn auf dem virtuellen Server erstmal so gelassen, wie voreingestellt, nämlich auch "on". Somit erübrigt sich shell_exec() erstmal so direkt in jedem directory. Übers cgi-bin ließe sich dann was machen. Oder den safe_mode() für ein bestimmtes Verzeichnis/Vhost ausschalten u.U.. Das wollt ich nur im Hinterkopf haben. Und dann eben erstmal schauen, was beim Word-Export, durch UnRTF und tidy geschleust am Ende herauskommt.

          Dank und Gruß,

          frankx

          --
          tryin to multitain  - Globus = Planet != Welt
          1. Hallo.

            Die beiden Programme kannte ich bisher nicht, an RTF hatte ich auch bisher noch nicht gedacht.

            Ich bin im Rahmen eines CMS-Projektes damit in Berührung gekommen und fand es allemal praktischer als den direkten Export aus Word heraus. Tidy sollte man aber eigentlich kennen, wobei es in viele Editoren integriert ist, womit sich eine gesonderte Installation erübrigt. Naja, außerdem sieht HTML-Code heute ja meist ohnehin schon besser aus als noch vor wenigen Jahren, und auf Einrückungen oder Leerzeilen verzichtet heute auch sicher kaum noch jemand wegen der geringeren Datenmenge. Aber beim Word-Export weiß man ja nie.

            Wollte eben nur sichergehen, dass ich dann dem richtigen Pfad folge bzw. den Ansatz kapiere. Auch wenn der "safe mode" eigentlich "missbraucht" wird, habe ich ihn auf dem virtuellen Server erstmal so gelassen, wie voreingestellt, nämlich auch "on". Somit erübrigt sich shell_exec() erstmal so direkt in jedem directory. Übers cgi-bin ließe sich dann was machen. Oder den safe_mode() für ein bestimmtes Verzeichnis/Vhost ausschalten u.U.. Das wollt ich nur im Hinterkopf haben.

            Ja, stimmt, keine Sicherheitslücken aufreißen. Darauf hätte ich hinweisen sollen, aber du bist ja schließlich vom Fach und schaltest im Fragemodus nicht einfach den Kopf ab.

            Und dann eben erstmal schauen, was beim Word-Export, durch UnRTF und tidy geschleust am Ende herauskommt.

            Regelrechte Wunder sind sicher nicht zu erwarten, aber für die meisten Dokumente sollte es genügen und vor allem recht schlanken und sauberen Code produzieren.
            MfG, at