Thomas: Screenvideo per OCR einlesen (Zahlen)

Hallo,
möchte gerne sich ca. jede Sekunde ändernde Zahlen von einem Screenvideo per OCR einlesen
(die Zahlen können sich auch zwei bis dreimal in der Sekunde ändern, oder ein paar Sekunden lang gar nicht.).

Bin mir nicht sicher ob ich das hinbekomme und wie man das machen sollte.

Ginge das mit der Software screenocr? Oder mit welcher Software?
Bzw. muß man dazu ein extra Automatisierungsscript etc. schreiben?

Danke
Thomas

  1. Hi!

    möchte gerne sich ca. jede Sekunde ändernde Zahlen von einem Screenvideo per OCR einlesen

    Serverseitig oder clientseitig?

    Ginge das mit der Software screenocr?

    Die ist mir unbekannt.

    Oder mit welcher Software?

    Ich kenne zwar einige OCR-Programme, allerdings handelt es sich bei den wirklich Guten um propriätere Windows-Software.
    Das beste, mir bekannte OCR-Programm ist der Abbyy Finerader.
    Ich habe noch mit keinem anderen Programm gearbeitet, daß mir eine so gute Texterkennungsrate brachte.
    Da konnte auch kein Omnipage und kein Acrobat mithalten.

    Mit solchen Programmen hast du allerdings sicherlich keine Chance, da du diese Programme vermutlich nur manuell bedienen kannst und nicht die Möglichkeit hast, etwas zu automatisieren bzw. per Script zu arbeiten.

    Als freie OCR-Software sind mir GOCR und Tesseract OCR bekannt.

    GOCR habe ich mir vor einiger Zeit mal angesehen, als ich ein OCR-Tool für Linux brauchte. Leider war ich von den Ergebnissen nicht besonders begeistert. Aber da tut sich ja vielleicht in nächster Zeit noch was.

    Von Tesseract weiß ich, daß es sich dabei um Code handelt, der ursprünglich von Hewlett-Packard entwickelt und später frei gegeben wurde. Jetzt wird dieses Projekt von Google unterstützt.
    Ich habe das selbst noch nicht getestet und kann daher keine Aussage über die Qualität machen.

    Da es sich bei beiden Projekten um Programme handelt, die ohne grafische Oberfläche funktionieren, könntest du mit beiden etwas anfangen.

    Bzw. muß man dazu ein extra Automatisierungsscript etc. schreiben?

    Ja. Das müßtest du wohl.

    Du könntest ein Script schreiben, daß so einem OCR-Tool ein Bild übergibt und versucht, den enthaltenen Text zu erkennen.
    Da du allerdings kein Video übergeben kannst, bräuchtest du noch ein weiteres Tool, was Screenshots von deinem Video erstellt, die du dann an die OCR-Software verfüttern kannst.

    Und dann ist noch zu erwähnen, daß es auch etwas für PHP gibt.
    Vielleicht kannst du damit auch etwas anfangen.
    Ich habe nie damit gearbeitet und es mir auch nie angeschaut.
    Ich weiß nur, daß es dieses Projekt gibt: phpOCR Klasse
    (Wenn jemand damit schon mal gearbeitet hat und mir was genaueres dazu sagen könnte, würde ich mich freuen. Das klingt zumindest recht interessant.)

    Schöner Gruß,
    rob

    1. Hallo,

      möchte gerne sich ca. jede Sekunde ändernde Zahlen von einem Screenvideo per OCR einlesen
      Serverseitig oder clientseitig?

      ...das Video liegt auf meinem Client. ;-)

      Ginge das mit der Software screenocr?
      Die ist mir unbekannt.

      http://www.screenocr.com/

      Also, sehe ich das richtig, dass es zwei Möglichkeiten gibt?:
      1. Video in Einzelbilder speichern (ist mit Videosoft ja nicht ein Problem),
      dann diese Bilder an ein OCR Prog. geben (per script) und Daten (Zahlen)
      werden zB. in einer Textdatei als CSV gespeicher.

      2. Vom Video direkt ála "screenocr" scannen (Texterkennen) und in einer Textdatei als CSV gespeichern.

      Oder gäbe es noch eine dritte Lösung?
      Danke
      Thomas

      1. Hi!

        Oder gäbe es noch eine dritte Lösung?

        Ich sehe nur eine einzige Lösung.
        Ob die OCR-Software jetzt direkt mit dem Video oder nur mit einzelnen Bildern klar kommt, macht ja keinen großen Unterschied.
        In jedem Fall: OCR-Software drüber laufen lassen und die Zahlen dann auswerten.
        Wenn du eine OCR-Software hast, die du per Kommandozeile bedienen kannst, dann hast du natürlich die Möglichkeit, alles zu automatisieren.
        Wenn du ein Programm wie den Finereader verwenden würdest, bliebe dir nur die Option zur manuellen Bedienung, womit du nicht viel anfangen kannst.

        Mit welcher Sprache du dein Programm steuerst und die erhaltenen Daten dann auswertest, ist eigentlich auch zweitrangig. Das geht mit so gut wie jeder Sprache, die du zur Verfügung hast.

        Schöner Gruß,
        rob

        1. Wenn du ein Programm wie den Finereader verwenden würdest, bliebe dir nur die Option zur manuellen Bedienung, womit du nicht viel anfangen kannst.

          Da irrst du dich. FineReader lässt sich per Kommandozeile ansprechen und automatisieren.

          Beispiel:

          fineocr.exe "C:\abc\xyz.bmp" /lang Deutsch /send clipboard /optionsfile "C:\abc\xyz.fbt"

          (Die Optionfile ist zu empfehlen (und nat. zuvor zu manuell in FineReader zu erstellen) um die Erkennungsrate zu verbessern, aber kein Muss wenn FineReader auch so ausließt.

          Grüße

          spcx