selfuser: PDF zu HTML konvertieren

Hallo,

Wie kann ich ein PDF (enthält Bilder (zum Teil gedrehte), Hintergrundbild (tiled), Textblöcke mit speziellen Schriftarten (zum Teil mit Schatten) und natürlich Links) in ein HTML-Dokument konvertieren? (Das Ursprungsformat ist Pages/Mac und ist bestimmt auch nicht hilfreich.)

Kann man überhaupt das Original-Design ohne Verluste beibehalten? Exakte Schriftgröße und Breite der Textblöcke wären nicht so wichtig.

Ich habe schon einige "PDF to HTML Converter" (Mac App Store und Test-Versionen) ausprobiert, jedoch mit sehr schlechtem Resultat. :-(

Vielen Dank.

  1. Moin!

    (Das Ursprungsformat ist Pages/Mac und ist bestimmt auch nicht hilfreich.)

    Kenn ich nicht. Kann das Ding LaTeX exportieren? Aus LaTeX kann man recht einfach html erzeugen. Aber ob die Ergebnisse zufrieden stimmen weiß ich auch nicht.

    Jörg Reinholz

    1. Danke Jörg,

      Kann das Ding LaTeX exportieren?

      Nein, nur PDF, PostScript (.ps), ePub, Word, RTF.

      1. Naja. Für Epub und RTF gibt es einige Konverter. Selbst Word kann HTML exportieren. Die Ergebnisse sind aber auf keinen Fall brauchbarer als der Export.

        Aber man kann mit den unter Linux gängigen Tools auch ganz fix eine Grafik pro PDF-Seite exportieren und einen schicken Betrachter drumrum basteln :-)

        Oder halt das PDF zum Download anbieten.

        Jörg Reinholz

  2. Hallo,

    Ich habe schon einige "PDF to HTML Converter" (Mac App Store und Test-Versionen) ausprobiert, jedoch mit sehr schlechtem Resultat. :-(

    was war denn schlecht? Das Aussehen oder das HTML?

    Gruß Jürgen

    1. was war denn schlecht? Das Aussehen oder das HTML?

      Die Bilder waren nicht einzeln, sondern zu Gruppen zusammengefasst und die Qualität schlechter. Es wurden andere Schriftarten genommen. Die Farben der Schriften stimmten nicht überein. Das Hintergrundmuster (ursprünglich tiled) war nicht mehr homogen, sondern mit Streifen. Manche Links waren nicht mehr klickbar. (Vielleicht habe ich noch einiges vergessen.)

      1. Moin!

        (Vielleicht habe ich noch einiges vergessen.)

        Oder zu hohe Erwartungen.

        Jörg Reinholz

        1. Oder zu hohe Erwartungen.

          Möglich. Ich dachte halt erst mal es ginge besser...

          Anscheinend muss ich eine "abgemagerte" Version machen vor dem Konvertieren

          • wahrscheinlich eine Tabellenstruktur - denn die Positionierungen werden nicht eingehalten.

          Auf spezielle Schriften und Schrift-Schatten (daneben platziert) verzichte ich besser auch.

  3. hi,

    bei den wirklich zahlreichen, freien online-Angeboten lieferte keines zufriedenstellende Ergebnisse?

    Manche (glaube ich) davon haben auch eine API. Upps ... hab grad gesehen, zamzar gibt's nicht mehr kostenfrei. Na, ja, auf jeden Fall gab's mal einen Service, der das zufriedenstellend hinbekam. Vielleicht ermutigt dich ja das zur Suche.

    Ansonsten: Probier mal (solltest du's noch nicht aufm radar haben) http://www.pdfonline.com/ Funktionierte bei meiner Abschlussarbeit einwandfrei.

    lg

    1. Ansonsten: Probier mal (solltest du's noch nicht aufm radar haben) http://www.pdfonline.com/ Funktionierte bei meiner Abschlussarbeit einwandfrei.

      Danke, werde ich mal testen. Abschlussarbeiten bestehen wohl überwiegend aus Text mit einigen Abbildungen, daher bin ich mir sicher dass so etwas ohne große Probleme konvertierbar ist.

      1. http://www.pdfonline.com/

        Danke, werde ich mal testen.

        Wirklich nicht schlecht. Besser als die anderen Konverter! Nur ein Link ging verloren, und ein paar Rahmen waren versetzt. Schriften wurden nur unter dem Gesichtspunkt der Größe ersetzt. Ich werde jedenfalls manuell nacharbeiten...

      2. Moin!

        Abschlussarbeiten

        Oh. Es gab zumindest früher Unis und Hochschulen, die haben verlangt, dass Abschlussarbeiten in LaTeX eingereicht werden...

        (Die daraus generierten PDF (und die Ausdrucke auch) sehen übrigens "unschlagbar klasse" aus - mir konnte aber auch noch niemand erklären, warum das so ist.)

        Jörg Reinholz