Text auf eingescannten Dokumenten editieren (OCR)
Karl
- sonstiges
Guten morgen,
per SMB scanne ich Dokumente in einen freigegebenen Ordner auf meinem PC. Am Multifunktionsgerät selbst kann ich sagen, das gescannte Dokument soll als "PDF", "JPG" oder "TIFF" im freigegebenen Ordner abgelegt werden.
Leider habe ich aber keine Möglichkeit den Text der eingescannten Dokumente zu ändern.
Hab da mal den Begriff OCR aufgeschnappt. Damit kann wohl irgendwie der Text erkannt werden und ich habe anschließend die Möglichkeit z.B. mit Word das eingescannte Dokument zu bearbeiten.
Bin in praktischer Hinsicht bei dieser Umsetzung aber total überfordert, was muss ich denn tun um das gescannte Dokument anschließend editieren zu können? Brauche ich irgendeine Software und wenn ja, wo kann ich die bekommen?
Hello,
Hab da mal den Begriff OCR aufgeschnappt. Damit kann wohl irgendwie der Text erkannt werden und ich habe anschließend die Möglichkeit z.B. mit Word das eingescannte Dokument zu bearbeiten.
was muss ich denn tun um das gescannte Dokument anschließend editieren zu können?
Du hast doch das Stichwort "OCR" schon genannt.
Da würde ich jetzt z.B. mal die Wikipedia und die Suchmaschinen befragen, was die mir darüber erzählen können.
http://lmgtfy.com/?q=OCR
http://de.wikipedia.org/wiki/Texterkennung
Omnipage und Textbridge habe ich selber schon zur Genüge benutzt. Sooo sehr begeistert bin ich aber auch heute noch nicht vom Ergebnis. Es muss dann wohl doch eher die Superteuervollversion sein, wenn es ohne Nacharbeit klappen soll.
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg

Moin!
Omnipage und Textbridge habe ich selber schon zur Genüge benutzt. Sooo sehr begeistert bin ich aber auch heute noch nicht vom Ergebnis. Es muss dann wohl doch eher die Superteuervollversion sein, wenn es ohne Nacharbeit klappen soll.
Bin mir nicht sicher, dass die das besser koennen. Ich hab hier ein Tool, das quasi nichts anderes macht als Adressen zu korrigieren. Zahlendreher bei Postleitzahlen sind ja normal. Aber sooft wie ich z.B. 64489 Muehlheim statt 54489 bekomme (oder 57786 und aehnliches halt). Ich fuehre sowas auf OCR zurueck.
Hello,
Omnipage und Textbridge habe ich selber schon zur Genüge benutzt. Sooo sehr begeistert bin ich aber auch heute noch nicht vom Ergebnis. Es muss dann wohl doch eher die Superteuervollversion sein, wenn es ohne Nacharbeit klappen soll.
Bin mir nicht sicher, dass die das besser koennen. Ich hab hier ein Tool, das quasi nichts anderes macht als Adressen zu korrigieren. Zahlendreher bei Postleitzahlen sind ja normal. Aber sooft wie ich z.B. 64489 Muehlheim statt 54489 bekomme (oder 57786 und aehnliches halt). Ich fuehre sowas auf OCR zurueck.
Naja, ich habe mal für einen Lettershop gearbeitet. Die hatten da eine wirklich gute Software. Leider weiß ich nicht mehr, wie sie hieß. Ich weiß nur, dass die damals so um die 10.000 DM gekostet hat. Und der Chef von dem Laden war garantiert geizig.
Ich konnte die meisten Daten ohne Nachbesserung übernehmen und die paar fraglichen Datensätze waren dann bis auf ganz seltene Ausnahmen auch alle als fraglich markiert.
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg

Hab noch eine Frage die sich in eine ähnliche Richtung bewegt. Angenommen ich habe ein Formular, welches 20 Seiten umfasst. Das Formular besteht aus sehr viel Text und außerdem aus Feldern die entsprechend ausgefüllt werden müssen. Das Ausfüllen der Felder würde ich gerne am PC durchführen. Weitere Annahme, dass Formular liegt nicht im elektronischen Format vor. Ich möchte nun das Formular einscannen und anschließend die Felder die leer sind irgendwie mit dem PC ausfüllen. Eine Texterkennung (OCR) ist im Prinzip nicht notwendig, ich will ja keinen Text verändern sondern lediglich dazu in der lage sein leere Felder im Formular auszufüllen. Kann ich dass irgendwie umsetzen, ohne eine OCR verwenden zu müssen?
Hello,
Hab noch eine Frage die sich in eine ähnliche Richtung bewegt. Angenommen ich habe ein Formular, welches 20 Seiten umfasst. Das Formular besteht aus sehr viel Text und außerdem aus Feldern die entsprechend ausgefüllt werden müssen. Das Ausfüllen der Felder würde ich gerne am PC durchführen. Weitere Annahme, dass Formular liegt nicht im elektronischen Format vor. Ich möchte nun das Formular einscannen und anschließend die Felder die leer sind irgendwie mit dem PC ausfüllen. Eine Texterkennung (OCR) ist im Prinzip nicht notwendig, ich will ja keinen Text verändern sondern lediglich dazu in der lage sein leere Felder im Formular auszufüllen. Kann ich dass irgendwie umsetzen, ohne eine OCR verwenden zu müssen?
Ja, dafür gibt es Software und man könnte sich auch selber welche dafür erstellen, wenn es sich um immer dieselben Vorlagen handelt. Das geht z.B. schon mit Word, Hintergrundgrafik und Textrahmen und darin eingebundenen Datenfeldern.
Guck mal bei Goolge unter "Formfiller"
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg

Sorry wegen dem Doppelposting, vielleicht kannst du mir folgende Frage ja hier beantworten:
Hallo,
soviel ich weiß gibt es ja den Acrobat Writer. Damit kann man dann wohl PDF's genauso bearbeiten, wie ich ein Word Dokument bearbeite oder?
Was ich dann aber nicht verstehe ist folgendes Szenario:
Kann ich das Dokument nun bearbeiten oder nicht? Hab ja kein OCR verwendet, demnach handelt es ich doch eigentlich um ein Bild und nicht um ein PDF das ich mit dem Acrobat Writer editieren kann?
Hab da ein Brett vorm Kopf und wäre für Hilfe dankbar.
Hello,
Kann ich das Dokument nun bearbeiten oder nicht?
Der Acrobat Writer wird in dem Dokument ein Bild vorfinden und keinen Text.
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg

:-) schonmal vielen Dank für die super Hilfe bisher, so langsam wird mir der Zusammenhang klar.
Eine letzte Frage hätte ich noch:
Es gibt doch manchmal PDF-Dokumente die z.B. von Behörden zur Verfügung gestellt werden. Dort hat man dann teilweise die Möglichkeit die PDF-Dokumente mit Hilfe des Acrobat Readers auszufüllen. Hier verstehe ich den Zusammenhang nicht. Der Acrobat Reader ist doch nur zum Lesen der Dokumente gedacht und nicht zum editieren. Warum klappt das also trotzdem.
Wie kann ich mir denn solch ein PDF-Dokument selbst erstellen, in welchem ich anschließend bestimmte Felder mit Hilfe des Acrobat Readers bearbeiten kann?
Hello,
:-) schonmal vielen Dank für die super Hilfe bisher, so langsam wird mir der Zusammenhang klar.
Eine letzte Frage hätte ich noch:
Es gibt doch manchmal PDF-Dokumente die z.B. von Behörden zur Verfügung gestellt werden. Dort hat man dann teilweise die Möglichkeit die PDF-Dokumente mit Hilfe des Acrobat Readers auszufüllen. Hier verstehe ich den Zusammenhang nicht. Der Acrobat Reader ist doch nur zum Lesen der Dokumente gedacht und nicht zum editieren. Warum klappt das also trotzdem.
Wie kann ich mir denn solch ein PDF-Dokument selbst erstellen, in welchem ich anschließend bestimmte Felder mit Hilfe des Acrobat Readers bearbeiten kann?
Diese Dokumente werden ja nicht selber verändert durch die Eintragungen, sondern können nur mit den Eintragungen "gedruckt" werden. Und dies kann man dann auch wieder über den PDF-Printer machen, sofern man einen eingerichtet hat oder eben auf den normalen Drucker.
Übrigens hat der reader auch schon eine ganze Menge Module an Bord, mit denen Dokumentbearbeitung geht. Die sind nur "stillgelegt". Was Adobe da noch alles eingebaut hat, da bin ich mir nicht sicher, aber es muss nicht alles wohlgemeint sein... :-((
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg

Moin!
Auch der Reader sollte doch ausgefuellte Dokumente speichern koennen?
Moinsen!
Dann smackst Du einfach Formularfelder ueber die Grafik. Schoen is was anderes. Eine Suche funktioniert so nicht.