nijo: PDF Dateien mittels PHP durchsuchen

Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
Hat jmd Tipps wie man die Sache am besten angeht?

Danke!

- Nijo

  1. Hi,

    Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.

    es gibt in PHP libraries die mit PDF umgehen können, dass findest Du auf http://www.php.net
    Vielleicht gibt es auch eine Option den ganzen Inhalt als Text (String) einzulesen!? Diesen dann zu durchsuchen müsste eigentlich recht einfach gehen.

    ciao
    romy

  2. Hallo,

    Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
    Hat jmd Tipps wie man die Sache am besten angeht?

    Einfache Ideen fuer einfache Loesungen:
    * Ganzen Datei-Inhalt in eine String-Variable einlesen:
      $str = implode("", file("datei"));
      vgl. http://www.dclp-faq.de/q/q-datei-lesen.html
    * Dann auf den String $str die ueblichen String-Funktionen anwenden, vgl.
      http://www.php.net/manual/de/ref.strings.php

    Die PDF-Funktionen ("Bibliothek") von PHP selbst sind soweit ich sehe
    primaer dazu gedacht, PDF-Dateien zu erzeugen:
    http://www.php.net/manual/de/ref.pdf.php

    Mehr ueber den Aufbau von PDF-Dateien erfaehrst Du mit etwas
    Recherche oder indem Du ein paar PDF-Dateien in einem
    Hex-Editor anguckst.

    HTH, mfg
    Thomas

  3. Hi!

    Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
    Hat jmd Tipps wie man die Sache am besten angeht?

    Installiere Dir ein Tool was das für Dich macht, z.B. pdftotext, dem übergibst Du den Dateinamen per system() und bekommst dann den Inhalt der PDF-Datei als Rückgabewert. Denn kannst Du dann wie jeden anderen Text durchsuchen.

    Grüße
    Andreas