MudGuard: Textsuche in PDF-Dateien

Beitrag lesen

Hi,

In PDF-Dateien kann Text enthalten sein, muss es aber nicht. Speziell bei eingescannten Dokumenten kommt es auf das verwendete Programm und/oder auf den Workflow an, ob das Dokument nur als Bild gescannt und genau so in die PDF-Datei eingefügt wird, oder ob eine Texterkennung stattfindet (Stichwort „OCR“) und der erkannte Text als Text in der PDF-Datei landet.

Ergänzung: Erkennbar ist's im PDF-Betrachter daran, ob sich Text zeichen-/wortweise im PDF selektieren läßt …

cu,
Andreas a/k/a MudGuard