Thomas Luethi: PDF Dateien mittels PHP durchsuchen

Beitrag lesen

Hallo,

Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
Hat jmd Tipps wie man die Sache am besten angeht?

Einfache Ideen fuer einfache Loesungen:
* Ganzen Datei-Inhalt in eine String-Variable einlesen:
  $str = implode("", file("datei"));
  vgl. http://www.dclp-faq.de/q/q-datei-lesen.html
* Dann auf den String $str die ueblichen String-Funktionen anwenden, vgl.
  http://www.php.net/manual/de/ref.strings.php

Die PDF-Funktionen ("Bibliothek") von PHP selbst sind soweit ich sehe
primaer dazu gedacht, PDF-Dateien zu erzeugen:
http://www.php.net/manual/de/ref.pdf.php

Mehr ueber den Aufbau von PDF-Dateien erfaehrst Du mit etwas
Recherche oder indem Du ein paar PDF-Dateien in einem
Hex-Editor anguckst.

HTH, mfg
Thomas