suchen in PDF von Alexander Foken, 20.03.2003 12:56

SELF-Forum

suchen in PDF

Martina Stagel 20.03.2003 09:45

– Informationen zu den Bewertungsregeln

Hallo,

gibt es eine Möglichkeit mittels PHP Dokumente im Format PDF nach Strings zu durchsuchen? Wenn ja, wie?

Vielen Dank

Martina

Beitrag melden

– Informationen zu den Bewertungsregeln

suchen in PDF
Alexander Foken 20.03.2003 12:56

php
– Informationen zu den Bewertungsregeln
Moin Moin !

Hast Du schon php.net und Google befragt?

Mein Weg wäre, die PDF-Datei(en) erstmal durch pdf2ps und dann durch ps2ascii zu jagen, beides Tools aus Ghostscript. Dann hast Du "plain text", den Du mit beliebigen Tools durchsuchen kannst.

Je nach Maschine willst Du pdf2ps und ps2ascii nicht für jede Suche erneut anwerfen, sondern zu jeder PDF-Datei einen ASCII-Auszug "daneben legen" und bei Änderungen an der PDF-Datei für eine Aktualisierung des ASCII-Auszugs sorgen.

Bei gescannten PDFs (z.B. einfach ein FAX in eine PDF-Datei gedrückt, anscheinend in Asien bei Technik-Firmen üblich) hast Du natürlich ohne OCR verloren, wie jedes andere Tool auch.

Alexander

--
Nein, ich beantworte keine Fragen per eMail. Dafür ist das Forum da.
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so!"
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. suchen in PDF
  
  Martina 20.03.2003 15:55
  
  php
  – Informationen zu den Bewertungsregeln
  Mein Weg wäre, die PDF-Datei(en) erstmal durch pdf2ps und dann durch ps2ascii zu jagen, beides Tools aus Ghostscript. Dann hast Du "plain text", den Du mit beliebigen Tools durchsuchen kannst.
  
  Danke! So werd ich das machen. Woher bekommt man die Ghostscrips LIB?
  Läuft die als MOD?
  
  Vielen Grüße
  
  Martina
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. suchen in PDF
    
    Alexander Foken 20.03.2003 17:22
    
    php
    
    – Informationen zu den Bewertungsregeln
    Moin Moin !
    
    Mein Weg wäre, die PDF-Datei(en) erstmal durch pdf2ps und dann durch ps2ascii zu jagen, beides Tools aus Ghostscript. Dann hast Du "plain text", den Du mit beliebigen Tools durchsuchen kannst.
    
    Danke! So werd ich das machen. Woher bekommt man die Ghostscrips LIB?
    
    Hab ich was von Lib gesagt?
    
    Läuft die als MOD?
    
    Nein, als externes Programm.
    
    http://www.google.de/search?q=rate+mal+was+du+hier+eingeben+mu�t+um+ghostscript+zu+finden
    
    Alexander
    
    --
    Nein, ich beantworte keine Fragen per eMail. Dafür ist das Forum da.
    Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so!"
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Martina Stagel: suchen in PDF

suchen in PDF

suchen in PDF

suchen in PDF

suchen in PDF

suchen in PDF