tag:forum.selfhtml.org,2005:/self HTML (oder CHM) aus .doc -- welche Werkzeuge gibt es, welche sind empfehlenswert? Wie .doc vorbereiten? – SELFHTML-Forum 2020-03-26T13:13:53Z https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767696#m1767696 F. T. T. 2020-03-24T11:40:34Z 2020-03-24T11:40:34Z HTML (oder CHM) aus .doc -- welche Werkzeuge gibt es, welche sind empfehlenswert? Wie .doc vorbereiten? <p>Guten Tag Foristen,</p> <p>ich stehe gerade vor folgendem Problem:</p> <p>Auf der <strong>Eingangsseite</strong> steht ein <strong>Word-Dokument</strong> (.doc [sic]), eine Software-Referenz mit ca. 200 Seiten, die bisher als PDF zur Software dazugegeben wurde.</p> <p>Auf der <strong>Ausgangsseite</strong> hätte ich gerne eine (oder mehrere) <strong>HTML- oder CHM-Datei(en)</strong> oder eine sonstige Datei, die ich als Hilfe direkt in die Software einbauen kann. Ziel ist es, aus einzelnen Dialogen heraus mit einem Mausklick oder über [F1] die entsprechende Seite in der Hilfe aufzurufen.</p> <p>Randbedingungen sind:</p> <ul> <li>Das ganze sollte möglichst automatisiert ablaufen. Denn gepflegt wurde, und wird wohl auch in Zukunft, nur die .doc-Datei. Nicht meine Entscheidung…</li> <li>Die Hilfe muss lokal mit der Software ausgeliefert werden. Online kommt nicht in Frage, da nicht alle Rechner, auf denen die Software läuft, am Netz sind (industrielles Umfeld).</li> </ul> <p>Ich habe bisher das Word-Dokument, so weit als möglich, semantisch strukturiert. HTML-Export aus Word liefert aber nur unbefriedigende Ergebnisse, und CHM-Export bietet Word schon mal gar nicht an.</p> <p>Ich wünsche mir ein Werkzeug, das mir aus dem Word-Dokument sauberes HTML oder CHM erzeugt. Sehr gerne kann es dabei die Datei anhand der Überschriften in Unterseiten zerlegen, damit nicht für jedes Hilfefenster zweihundert Seiten Text geladen werden müssen.</p> <p>Für alle Tips auf aktuelle, funktionierende Software bin ich dankbar!</p> <p>Beste Grüße und bleibt gesund</p> <p>F. T. T.</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767702#m1767702 Mitleser 2020-03-24T15:01:00Z 2020-03-24T15:01:00Z HTML (oder CHM) aus .doc -- welche Werkzeuge gibt es, welche sind empfehlenswert? Wie .doc vorbereiten? <blockquote> <p>Auf der <strong>Eingangsseite</strong> steht ein <strong>Word-Dokument</strong> (.doc [sic]), eine Software-Referenz mit ca. 200 Seiten, die bisher als PDF zur Software dazugegeben wurde.</p> </blockquote> <p>Bleib dabei.</p> <blockquote> <p>Ich wünsche mir ein Werkzeug, das mir aus dem Word-Dokument sauberes HTML oder CHM erzeugt.</p> </blockquote> <p>Ich wüsste nicht, dass es so etwas gäbe (mir fehlt sogar die Fantasie, dass das möglich sein soll), lass mich aber gerne eines besseren belehren.</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767703#m1767703 Rolf B 2020-03-24T15:23:34Z 2020-03-24T15:24:46Z HTML (oder CHM) aus .doc -- welche Werkzeuge gibt es, welche sind empfehlenswert? Wie .doc vorbereiten? <p>Hallo F.T.T.,</p> <p>vor 12 Jahren musste ich mal eine App pflegen wo die zentralen Steuer-Informationen in Word vorlagen. D.h. Gliederung erkennen, Auflistungen auslesen - das habe ich damals über einen Text-Only Export und hinreichend schlaues Hinschauen auf die Textstrukturen lösen können.</p> <p>Parallel musste ich noch Daten aus einer Excel-Tabelle dazumischen. Die habe ich über das Excel-COM Objekt geöffnet und bin über die Ranges geturnt. Das ist nicht schnell, aber das war ein Batch der nur ab und zu laufen musste, der konnte sich Zeit lassen. Meine Programmiersprache dafür war C#, das integriert COM Objekte ganz gut. Mit C++ wäre es wohl anstrengender geworden.</p> <p>Mit dem Word-COM Objekt kannst Du auch Word-Dokumente verarbeiten. Das habe ich allerdings noch nicht gemacht. Ich weiß auch nicht, welche Programmiersprache Du einsetzt und kann darum nicht sagen, wie geschmeidig das von der Hand gehen kann.</p> <p>Bei Dir wäre auch die Frage, wie umfangreich die Word-Vorlage die Möglichkeiten von Word nutzt. Wenn es nicht mehr ist als Überschriften und Fließtext, dann mag man da was automatisieren können. Wenn aber fleißig mit Word-Mitteln Textverarbeitung betrieben wird, dann wird es schwierig.</p> <p>Es ist generell schwierig, sich auf ein Tool festzulegen und dann zu sagen: Nun liefert mir die Adapter, damit ein Toolstack daraus wird. Das muss man umgekehrt machen: Erst festlegen, was man tun will, und dann die Tools dafür passend festlegen. Zugegeben, wenn erstmal Legacy da ist, ist eine Änderung schwer.</p> <p>Online-Hilfe und Referenzhandbuch sind allerdings auch Dokumente mit unterschiedlicher Zielsetzung. Ob man das eine automatisch aus dem anderen generieren kann, und zwar so, dass beides etwas taugt, da möchte ich meine Zweifel anmelden.</p> <p>Ich habe gerade mal etwas gegoogelt, und habe in einem MDSN Magazin von 2006 einen Hinweis auf fast-help.com gefunden. Das kostet Geld, aber damit könntest Du CHM-Dateien <em>und</em> PDF Dateien aus deiner Quelle erzeugen. Du müsstest es leider einmal von Word auf FastHelp umstellen. Mutmaßlich gibt es auch andere Tools dieser Art. Word ist keins.</p> <p><em>Rolf</em></p> <div class="signature">-- <br> sumpsi - posui - obstruxi </div> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767710#m1767710 jensp 2020-03-24T18:37:23Z 2020-03-24T18:37:23Z HTML (oder CHM) aus .doc -- welche Werkzeuge gibt es, welche sind empfehlenswert? Wie .doc vorbereiten? <p>Hallo F.T.T.,</p> <p>du könntest versuchen, ob sich mit Pandoc (https://pandoc.org/) ein brauchbares Ergebnis erzielen lässt.</p> <p>Viele Grüße</p> <p>Jens</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767716#m1767716 klawischnigg 2020-03-25T04:09:21Z 2020-03-25T04:09:21Z HTML (oder CHM) aus .doc -- welche Werkzeuge gibt es, welche sind empfehlenswert? Wie .doc vorbereiten? <p>Hi there,</p> <blockquote> <p>Für alle Tips auf aktuelle, funktionierende Software bin ich dankbar!</p> </blockquote> <p>OpenOfficeOrg resp. LibreOffice können doc-Dateien als HTML-Datei speichern. Wie brauchbar das ist vermag ich jetzt nicht zu beurteilen, aber wenn die einfachen Texte, die ich damit probiert habe, werden im Browser ganz passabel dargestellt...</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767764#m1767764 Raktendokumentexportbeschauer 2020-03-26T11:42:00Z 2020-03-26T11:42:00Z chtml, epup, pdf <blockquote> <p>Auf der Ausgangsseite hätte ich gerne eine (oder mehrere) HTML- oder CHM-Datei(en)</p> </blockquote> <p>Also, das <a href="https://de.wikipedia.org/wiki/CHM_(Dateiformat)" rel="nofollow noopener noreferrer">„Compiled HTML Help“ (Endung „.chm“)</a> ist leider ein wenig „außer der Zeit“. Siehe:</p> <ul> <li><a href="https://docs.microsoft.com/de-de/previous-versions/windows/desktop/htmlhelp/microsoft-help-mvp-program" rel="nofollow noopener noreferrer">https://docs.microsoft.com/de-de/previous-versions/windows/desktop/htmlhelp/microsoft-help-mvp-program</a></li> <li><a href="https://docs.microsoft.com/de-de/previous-versions/windows/desktop/htmlhelp/microsoft-html-help-downloads" rel="nofollow noopener noreferrer">https://docs.microsoft.com/de-de/previous-versions/windows/desktop/htmlhelp/microsoft-html-help-downloads</a></li> </ul> <p>Der Kern ist, dass eigentlich ein Frameset mit Einzeldokumenten und einer Überschriftenliste erzeugt wird. Anno 2003 hab ich das mal gemacht. Damals konnte man das machen, <a href="https://support.microsoft.com/de-de/help/896358/ms05-026-a-vulnerability-in-html-help-could-allow-remote-code-executio" rel="nofollow noopener noreferrer">für neue Projekte würde ich es nicht tun</a>.</p> <p><strong>Die für mich nahe liegenden Alternativen:</strong></p> <ul> <li>Ich hab mir den <strong>Export als epub3</strong> aus LibreOffice angesehen, der kann aber nur Literatur - also Text mit Überschriften. Grafiken, Listen, das Inhaltsverzeichnis etc. gehen verloren. Vermutlich ist das für Dich unbrauchbar.</li> <li>Ich habe mir mir den <strong>Export als HTML</strong> aus LibreOffice angesehen, der kann Einiges mehr. Allerdings befinden sich dann die Grafiken je nach Verankerung (eg: im Text, an der Seite) „nicht ganz genau dort, wo man diese zu finden hofft“. Brauchbar mit Vor- bzw, Nacharbeit.</li> <li><strong>Das beste Ergebnis lieferte immer noch der PDF-Export.</strong></li> </ul> <p><strong>Fazit:</strong></p> <p><em>„Ach hättest Du doch nur Pischti Hufnagel geheiratet“</em> (die Dateien mit LaTeX erstellt)!</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767765#m1767765 Rolf B 2020-03-26T11:43:59Z 2020-03-26T11:43:59Z chtml, epup, pdf <p>Hallo Raktendokumentexportbeschauer,</p> <p>das bescheuerte ist nur: Es gibt von Microsoft nichts neueres. Die haben HTML Help gefühlt im vorletzten Jahrhundert eingeführt, Windows hat sich 5 Generationen weiter entwickelt, aber das Hilfesystem ist eingeschlafen. Sowas macht man doch online... Leider nicht alle.</p> <p><em>Rolf</em></p> <div class="signature">-- <br> sumpsi - posui - obstruxi </div> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767769#m1767769 Raketendokumentexportbeschauer 2020-03-26T11:51:54Z 2020-03-26T11:51:54Z chtml, epup, pdf <blockquote> <p>Sowas macht man doch online... Leider nicht alle.</p> </blockquote> <p>Es gibt Situationen, in denen „online“ auf der Kundenseite unerwünscht ist oder zumindest nicht die einzige Option sein soll.</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767773#m1767773 ThomasM 2020-03-26T12:34:39Z 2020-03-26T12:34:39Z chtml, epup, pdf <p>Hallo zusammen,</p> <blockquote> <p>das bescheuerte ist nur: Es gibt von Microsoft nichts neueres. Die haben HTML Help gefühlt im vorletzten Jahrhundert eingeführt, Windows hat sich 5 Generationen weiter entwickelt, aber das Hilfesystem ist eingeschlafen. Sowas macht man doch online... Leider nicht alle.</p> </blockquote> <p>Ja, stimmt durchaus, aber CHM ist unter Windows bis 10 schon noch relevant.</p> <p>Ich erzeuge es bevorzugt via XSLT + letztem Prozessschritt über hhc.exe project.hhp. (hhc.exe hat man nach Installation des HTML Help Workshops vorliegen).</p> <p>Hier ein <a href="https://speakerdeck.com/xmlarbyter/anleitung-dot-docx-dot-zip-streifzug-durch-die-welt-der-containerformate" rel="nofollow noopener noreferrer">Vortrag</a> über so genannte Containerformate. Des <a href="https://tagungen.tekom.de/fileadmin/tx_doccon/slides/1463_Anleitung_docx_zip_Streifzug_durch_die_Welt_der_Containerformate.zip" rel="nofollow noopener noreferrer">gepackte Material (23 MB)</a> mit Code & Co. ist vielleicht auch interessant, aber für das Problem hier aus Word heraus wohl weniger. Eine eigene XML-Struktur + geeignete Transformation wäre aber ein gangbarer Weg.</p> <p>BTW, experimentell gefunden: mit <meta http-equiv="X-UA-Compatible" content="IE=edge" /> unterstützt der CHM-Viewer auch CSS3 und SVG. Normalerweise fällt dieser immer auf IE 7-Niveau runter. Make … </p> <p>Grüße,<br> Thomas</p> https://forum.selfhtml.org/self/2020/mar/24/html-oder-chm-aus-doc-welche-werkzeuge-gibt-es-welche-sind-empfehlenswert-wie-doc-vorbereiten/1767778#m1767778 Rolf B 2020-03-26T13:13:53Z 2020-03-26T13:13:53Z chtml, epup, pdf <p>Hallo ThomasM,</p> <blockquote> <p>CHM ist unter Windows bis 10 schon noch relevant.</p> </blockquote> <p>Ja, eigentlich wollte ich das auch ausgesagt haben. Es gibt nichts neueres, also ist es noch relevant. Aber es passt überhaupt nicht mehr ins Ökosystem. Und es ist lachhaft, dass es in Visual Studio keinen ab-Werk Projekttyp für Hilfeprojekte gibt. Immerhin gibt's im .net Framework Supportklassen dafür.</p> <p><em>Rolf</em></p> <div class="signature">-- <br> sumpsi - posui - obstruxi </div>