Reiner: pdf -> jpg/gif/bmp... -> ocr -> txt

Hallo zusammen,

kennt jemand ein Programm möglichst unter GPL o.ä., das über ein PDF eine Texterkennung machen kann?
Wichtig wäre, daß auch eingebettete Bilder so erkannt werden. Reine Textextraktion aus PDF ist nicht so schwierig, aber wirkliche Erkennung schon eher.

Gibt es da etwas (auch als Funktionsbundle mehrerer Programme wie pdf2bmp -> bmp2txt), womit hier jemand Erfahrungen gesammelt hat.

Wichtig wäre, daß man das in einer Shell ausführen kann, also kein fertiges Windowsprogramm! Muß nicht kostenlos sein, aber auch keine überdimensionierten Lizenzen bzw. Knebel (Finereader!)...

Vielen Dank!

Gruß
Reiner