Antwort an „Der Martin“ verfassen

Hallo,

Vorsicht. Manche PDFs enthalten den Text als Grafik.

ja, sowas gibt's. Oder sie enhalten den Text zwar als Text, aber bei der Erzeugung wurde jedes Wort (noch extremer: jedes Zeichen) als einzelne Box positioniert. Sowas ist dann auch praktisch nicht durchsuchbar.

Dann findest Du - womit auch immer - gar nichts… es sei denn Du extrahierst die Grafik und schickst diese an ein OCR-Programm. Dann brauchst Du dafür Zeit und, naja, auch ein Quentschen Glück.

Ein Programm, das in dieser Disziplin überraschend gut ist, ist Microsoft OneNote.

Einen schönen Tag noch
 Martin

--
Ich fürchte, ich brauche ein neues Portemonnaie. Das alte ist leer.
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar

Ihre Identität in einem Cookie zu speichern erlaubt es Ihnen, Ihre Beiträge zu editieren. Außerdem müssen Sie dann bei neuen Beiträgen nicht mehr die Felder Name, E-Mail und Homepage ausfüllen.

abbrechen