PDF Dateien mittels PHP durchsuchen
nijo
- php
Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
Hat jmd Tipps wie man die Sache am besten angeht?
Danke!
- Nijo
Hi,
Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
es gibt in PHP libraries die mit PDF umgehen können, dass findest Du auf http://www.php.net
Vielleicht gibt es auch eine Option den ganzen Inhalt als Text (String) einzulesen!? Diesen dann zu durchsuchen müsste eigentlich recht einfach gehen.
ciao
romy
Hallo,
Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
Hat jmd Tipps wie man die Sache am besten angeht?
Einfache Ideen fuer einfache Loesungen:
* Ganzen Datei-Inhalt in eine String-Variable einlesen:
$str = implode("", file("datei"));
vgl. http://www.dclp-faq.de/q/q-datei-lesen.html
* Dann auf den String $str die ueblichen String-Funktionen anwenden, vgl.
http://www.php.net/manual/de/ref.strings.php
Die PDF-Funktionen ("Bibliothek") von PHP selbst sind soweit ich sehe
primaer dazu gedacht, PDF-Dateien zu erzeugen:
http://www.php.net/manual/de/ref.pdf.php
Mehr ueber den Aufbau von PDF-Dateien erfaehrst Du mit etwas
Recherche oder indem Du ein paar PDF-Dateien in einem
Hex-Editor anguckst.
HTH, mfg
Thomas
Hi!
Wie das topic schon sagt, versuche ich PDF files mittels PHP nach strings zu durchsuchen.
Hat jmd Tipps wie man die Sache am besten angeht?
Installiere Dir ein Tool was das für Dich macht, z.B. pdftotext, dem übergibst Du den Dateinamen per system() und bekommst dann den Inhalt der PDF-Datei als Rückgabewert. Denn kannst Du dann wie jeden anderen Text durchsuchen.
Grüße
Andreas