Mit Tesseract als OCR-Engine hab ich gerade eben auch recht brauchbare Ergebnisse erzielt. Jedenfalls mit der richtigem Spracheinstellung liefert das gute Ergebnisse. Auch auf dem Raspi recht schnell.
-
Mit dessen Steuerprogramm
ocrmypdf
(und eben der richtigen Spracheinstellung) kann ich meine Scans durchsuchbar machen. Google liebt durchsuchbare PDFs … Ein paar meiner „Lieblinge“ werden demnächst vor Begeisterung weinen.