Der Martin: Suchen in PDF-Dateien

Beitrag lesen

Hallo,

Vorsicht. Manche PDFs enthalten den Text als Grafik.

ja, sowas gibt's. Oder sie enhalten den Text zwar als Text, aber bei der Erzeugung wurde jedes Wort (noch extremer: jedes Zeichen) als einzelne Box positioniert. Sowas ist dann auch praktisch nicht durchsuchbar.

Dann findest Du - womit auch immer - gar nichts… es sei denn Du extrahierst die Grafik und schickst diese an ein OCR-Programm. Dann brauchst Du dafür Zeit und, naja, auch ein Quentschen Glück.

Ein Programm, das in dieser Disziplin überraschend gut ist, ist Microsoft OneNote.

Einen schönen Tag noch
 Martin

--
Ich fürchte, ich brauche ein neues Portemonnaie. Das alte ist leer.