Simone: Pdf mit php einlesen ?

Hi,

Gibt es eine Funktion mit der man per php *.pdf einlesen bzw. parsen kann?

Danke,

Simone

  1. Hallo Simone,

    Gibt es eine Funktion mit der man per php *.pdf einlesen bzw. parsen kann?

    PHP hat einige PDF-Funktionen dabei, siehe http://php3.de/pdf.
    Auch die PHP_FAQ bieten dir weitere Informationen:
    23. PDF-Dateien
    http://www.php-faq.de/ch/ch-pdf_files.html

    Grüße
      David

    --
    >>Nobody will ever need more than 640k RAM!<<
    1981 Bill Gates
    1. Hi,  David

      Ich suche soetwas wie Gnome Ghost View (GGV) aus *.pdf werden *.txt
      aber das per php als Decompiler.

      Simone

      1. Hallo Simone,

        Ich suche soetwas wie Gnome Ghost View (GGV) aus *.pdf werden *.txt
        aber das per php als Decompiler.

        Und ich postete dir dazu Quellen, in denen du dich informieren kannst, wie du ein solches Script zusammenstellen kannst.

        Grüße
          David

        --
        >>Nobody will ever need more than 640k RAM!<<
        1981 Bill Gates
        1. Hallo!

          Ich suche soetwas wie Gnome Ghost View (GGV) aus *.pdf werden *.txt
          aber das per php als Decompiler.
          Und ich postete dir dazu Quellen, in denen du dich informieren kannst, wie du ein solches Script zusammenstellen kannst.

          Bist Du sicher?

          Ich würde sowas wie "Ghost View" über einen Komandozeilen-Aufruf starten, und die Arbeit erledigen lassen. Sonst musst Du in dessen Quellen gucken und versuchen das in PHP nachzuprogrammieren, naja, viel Spaß ;-)

          Grüße
          Andreas

          --
          SELFHTML Tipps & Tricks: http://aktuell.de.selfhtml.org/tippstricks/
          1. HI, Andreas

            Naja vielleicht gibt es ja irgendwo auch schon fertige Klassen dafür.

            Aber ich hab was ich gesucht habe: pdftotext

            system (my.bat); // ;))

            Danke, nochmal an alle

            1. Hallo!

              Naja vielleicht gibt es ja irgendwo auch schon fertige Klassen dafür.

              Aber ich hab was ich gesucht habe: pdftotext

              system (my.bat); // ;))

              Ja, genau so hätte ich es auch gemacht. Aber verlasse Dich nicht zu sehr darauf, ich habe bisher noch kein solches Tool gehabt, welches wirklich zuverlässig gearbeitet hat. Ich wollte damit mal Tabellen "digitalisieren", naja, hat nicht wirklich geklappt. Aber kommt natürlich drauf an was Du damit vorhast.

              Grüße
              Andreas

              --
              SELFHTML Feature Artikel: http://aktuell.de.selfhtml.org/artikel/
          2. Hallo Andreas,

            Und ich postete dir dazu Quellen, in denen du dich informieren kannst, wie du ein solches Script zusammenstellen kannst.
            Bist Du sicher?

            Jetzt nicht mehr ;)
            Ich muss zugeben, dass ich "Ghost View" kaum verwendet habe, sodass ich mich mit den Fähigkeiten nicht auskenne. Wenn es damit möglich ist, dann ist das sicher einfacher.

            Grüße
              David

            --
            >>Nobody will ever need more than 640k RAM!<<
            1981 Bill Gates
            1. Hi David!

              Und ich postete dir dazu Quellen, in denen du dich informieren kannst, wie du ein solches Script zusammenstellen kannst.
              Bist Du sicher?
              Jetzt nicht mehr ;)
              Ich muss zugeben, dass ich "Ghost View" kaum verwendet habe, sodass ich mich mit den Fähigkeiten nicht auskenne. Wenn es damit möglich ist, dann ist das sicher einfacher.

              Mir wäre neu wenn man mit den PDF-Funktionen von PHP auch PDFs _parsen_ (nicht erzeugen) kann.

              Grüße
              Andreas

              --
              SELFHTML Tipps & Tricks: http://aktuell.de.selfhtml.org/tippstricks/
              1. Hallo, Andreas!

                Mir wäre neu wenn man mit den PDF-Funktionen von PHP auch PDFs _parsen_ (nicht erzeugen) kann.

                och, warum nicht?
                wenn man pdf mit nem texteditor öffnet, sieht man dass das alles nur text ist.
                ich hab zumindest mal nen parser für *.eps gemacht (was ja in einem ähnlichen datenformat auch in pdf vorkommt), um das dann in eine, per php erzeugte pdf mit einzubinden.
                _alles_, was es in pdf gibt, in php nachzubauen, ist natürlich ne riesen arbeit, die man nur mit nem grossen team schafft.

                freundl. Grüsse aus Berlin, Raik

                1. Hallo, Andreas!

                  Mir wäre neu wenn man mit den PDF-Funktionen von PHP auch PDFs _parsen_ (nicht erzeugen) kann.
                  och, warum nicht?

                  oops, nicht genau gelesen. die pdf-funktionen hab ich natürlich nicht benutzt, sondern das ganze als text behandelt und mit regex "geparst".

                  freundl. Grüsse aus Berlin, Raik

  2. Also da würde ich an deiner stelle diese Seite aufrufen das ist die officielle seite zu php:
    http://www.php.net/manual/de/ref.pdf.php

    mfg dom