Wowbagger: spracherkennung

Hi leute,

ich habe da einen haufen handschriftlicher texte, die ich gerne in den computer bringen würde. Wie sieht es denn eigentlich momentan im bereich spracherkennung so aus *g*? Hat da jemand hier erfahrungen?
Die idee: Ich kaufe mir so ein nettes kleines headset, ziehe mir die entspr. software und _spreche_ den ganzen rotz einfach hinein, statt zu tippen ;)
Sind solche systeme heute schon verläßlich und überhaqupt brauchbar oder nach wie vor schiere spielerei?

so long...
/*,*/
Wowbagger

  1. Hi,

    ich habe da einen haufen handschriftlicher texte, die ich gerne in den computer bringen würde. Wie sieht es denn eigentlich momentan im bereich spracherkennung so aus *g*? Hat da jemand hier erfahrungen?
    Die idee: Ich kaufe mir so ein nettes kleines headset, ziehe mir die entspr. software und _spreche_ den ganzen rotz einfach hinein, statt zu tippen ;)
    Sind solche systeme heute schon verläßlich und überhaqupt brauchbar oder nach wie vor schiere spielerei?

    Ehrlich gesagt, bin ich absoluter Laie auf diesem Gebiet. Aber soweit ich weiß, sind die Ditktiersysteme
    bei ausreichend Rechenpower, Speicher und vor allem guten Mikrofon schon recht brauchbar.
    Wenn du die c't hast, such doch einfach mal in den Artikeln oder klicke hier :-)
    http://www.heise.de/ct/inhverz/search.shtml?T=spracherkennung

    Gruß,
    Slyh

  2. Hi Wowbagger,

    vermutlich hast Du die c''t nicht abonniert, denn da gab's in der vorletzten Ausgabe (17/2000, S. 118-133) ein paar Artikel zu dem Thema (Spracherkennungs-Software, Headsets). Die ersten zwei Seiten findest Du auch online unter http://www.heise.de/ct/00/17/118/. Wenn Du die c't nicht mehr bekommst (Bücherei oder so), melde Dich mal bei mir.

    Eigene Erfahrungen kann ich leider nicht beisteuern.

    Viele Grüße,
    Heiko

  3. Hallo Heiko, Slyh,

    ich glaube ich kann evtl. die alte CT morgen in der firma auftreiben...
    Danke erstmal für den tip ;)

    Es ist schon ein stück gute alte (altmodische) flexibilität, auf DINA5 blöcken zu schreiben, anstatt die stories gleich in den computer zu hacken (schmeiß nachts im bett 'mal ein notebook an und schreib' drauf los!), aber irgendwann hast du hunderte von seiten (ohne sch$%&ß!) und machst dir so langsam gedanken: "Wie bekomme ich die jetzt bloß alle in den rechner, du willst doch was einschicken und das nicht erst in 20 jahren...?!"

    Ich hoffe solche software ist tatsächlich schon ein wenig ausgereift...

    bis denn...*gähn*...
    /*,*/
    Wowbagger

    1. Hi,

      ich glaube ich kann evtl. die alte CT morgen in der firma auftreiben...
      Danke erstmal für den tip ;)

      Ich wollte dich nur noch darauf aufmerksam machen, daß - nach 2 Kommentaren zum Artikel zu urteilen -
      der Bericht nicht so toll zu sein scheint.
      http://www.heise.de/ct/forum/go.shtml?list=1&g=200017118

      Gute Nacht,
      Slyh

      1. Hi!

        Ich wollte dich nur noch darauf aufmerksam machen, daß - nach 2 Kommentaren zum Artikel zu urteilen -
        der Bericht nicht so toll zu sein scheint.
        http://www.heise.de/ct/forum/go.shtml?list=1&g=200017118

        So oberflächlich fand ich den Artikel gar nicht. (Will sagen: mir kam er nicht oberflächlich vor.)
        Die Komentare können aber schon zur weiteren Meinungsbildung beitragen denke ich.
        Im Gegensatz zu anderen Zeitschriften ist mir auch schon aufgefallen, dass die c't nicht alle ihre Erkenntnisse versucht in Tabellen zu quetschen sondern meist jedes Produkt einzeln beschreibt. Das ist vielleicht nicht immer ganz objektiv... ;-) Ich fin's aber gut.

        Zu deiner Aussage weiter unten:
        <cite>
        bei ausreichend Rechenpower, Speicher und vor allem guten Mikrofon schon recht brauchbar
        </cite>

        In der c't steht das genau andersrum:
        Billigmikros mit einem Frequenzgang  der ziemlich genau dem der menschl. Stimme entspricht sind scheinbar besser geeignet, weil Nebengeräusche weniger mit aufgenommen werden...

        mfg
        Stiefel

      2. Hi Slyh,

        Ich wollte dich nur noch darauf aufmerksam machen, daß - nach 2 Kommentaren zum Artikel zu urteilen -
        der Bericht nicht so toll zu sein scheint.

        hab ich auch gerade gelesen. Allerdings bezieht sich einer der Kritiker auf die PC Professionell, und ob die so der Hit in puncto unabhängiger Berichterstattung ist, lasse ich lieber mal unkommentiert (naja - ganz unkommentiert ist das nicht mehr ;-).
        Trotzdem hier der Link zum Test in der PCPro: http://www.zdnet.de/produkte/artikel/sw/200003/speech01_00-wc.html

        Viele Grüße,
        Heiko

  4. Hallo Wowbagger,

    im folgenden mal ein paar Zeilen, die ich gerade einer schlecht tainierten und etwas aelterer Version von Natural Speaking diktiert habe. Und zusaetzlich bin ich heute noch ein wenig verschnupft :-(

    --8<------------------
    Hallo Rau Parker ,
    nach dann wollen wir mal.
    Diese Antwort Tiere ich mal in einer etwas aelteren Versionen von NET Schule liegen die King.
    Wie du siehst ist schon einiges an nach Arbeit noetig.

    Und hier nun die korrigierte Versionen:

    Hallo Wowbagger,
    na dann wolen wir mal.
    Diese Antwort diktiere ich mal in einer etwas aelteren Version von Natural Speaking.
    Wie du siehst ist schon einigen an Nacharbeit noetig.

    Und hier nun die korrigierte Version:
    --8<------------------

    Wenn man diese Dinger sorgfaeltig trainiert und halbwegs konzentriert diktiert kann man schon recht beachtliche Resultate erzielen.

    Wichtig sind vorallen solche Dinge wie gutes Mikrofon, optimale Ausrichtung desselben und wenig Stoergeraeusche.

    Also bei meiner Tipp'geschwindigkeit' und deinen Anforderungen (hunderte ? von Seiten) wuerde ich das elektronische Diktat schon mal ausprobieren. Bei laeneren Texten stellt sich auch beim Sprecher ein gewisser Trainigseffekt ein (zumindest solange de Konzentration mitmacht) und die Resultate werden halbwegs brauchbar. Bei kuerzeren Texten, wie diesem Forumsbeitrag, ist der Korrekturaufwand  allerdings zu gross.
    Aeltere Versionen der grossen Erkenner gibt es z.T. schon recht guenstig (20.- bis 50.-) in den Supermaerkten. Und die sind lt. c't oft nicht viel schlechter als die aktuellen. Die haben vorallen kuerzere Trainingszeiten. Aber daran sollte man nun wirklich nicht sparen wenn man brauchbare Ergebnisse will.

    Viele Gruesse

    Gerd

    1. Hi Gerd,

      im folgenden mal ein paar Zeilen, die ich gerade einer schlecht tainierten und etwas aelterer Version von Natural Speaking diktiert habe. Und zusaetzlich bin ich heute noch ein wenig verschnupft :-(

      --8<------------------
      Hallo Rau Parker ,

      ROFTLMAO! Ist das jetzt etwa mein neuer nick? *G*

      Wie du siehst ist schon einigen an Nacharbeit noetig.

      etwas in der richtung habe ich ja geahnt...meine güte man stelle sich einmal eine _solche_ spracherkennung bei Star Trek vor:

      Kirk: (von panik ergriffen) "Computer! Schutzschilde auf maximale leistung! Ausweichkurs!"

      Computer: (kalt und sachlich) "Bitte wiederholen...eingabe war zu undeutlich"

      *RUMS*

      -----

      Wenn man diese Dinger sorgfaeltig trainiert und halbwegs konzentriert diktiert kann man schon recht beachtliche Resultate erzielen.

      Also im klartext: Vorarbeit ist angesagt! :((
      Was meinst du, wie lange man braucht, um die teile so zu trainieren, daß 100% ihre leistungsspanne erreicht werden können (na, hab' ich das jetzt nicht schön ausgedrückt? Hätte glatt von Spock sein können, auch wenn er wohl sicher den begriff "teile" vermieden hätte! *g*)

      Also bei meiner Tipp'geschwindigkeit' und deinen Anforderungen

      meine tippgeschwindigkeit ist wirklich hoch...dafür aber auch die fehlerquote (ist sie aber auch noch, wenn ich langsamer tippe...)

      bis denn...
      /*,*/
      Wowbagger

      1. Hallo Rau Parker , *G*

        Also im klartext: Vorarbeit ist angesagt! :((
        Was meinst du, wie lange man braucht, um die teile so zu trainieren, daß 100% ihre leistungsspanne erreicht werden können (na, hab' ich das jetzt nicht schön ausgedrückt? Hätte glatt von Spock sein können, auch wenn er wohl sicher den begriff "teile" vermieden hätte! *g*)

        Vorarbeit ist mit Sicherheit nötig.
        Die Minimalanforderungen von miner Version sind ca. 30 min Tariningstext, d.h. mit ein oder zwei Erholungspauseausen entsprechend länger. Für optimale Leistung stehen dann noch optional zusätzliche Lektionen von insgesamt ca. 1 bis 2 Stunden zur Verfügung.
        Beim regelmäßigen Gebrauch soll das Ding dannn noch stetig dazulernen. Wieviel das bringt kann ich allerdings nicht sagen. Da fehlt mir jedoch die Erfahrung. (ich muß mein System erst noch mal ohne Erkältung vernünftig trainieren.

        Gruß

        Gerd

        P.S. Vielleicht habe ich heute Abend mal Zeit zu testen was aus Kirks Befehlen wird.
        Allerdings befürchte ich auch das Ende der Enterprise. :-)))

        1. Hallo Wowbagger,

          etwas in der richtung habe ich ja geahnt...meine güte man stelle sich einmal eine _solche_ spracherkennung bei Star Trek vor:

          »»

          Kirk: (von panik ergriffen) "Computer! Schutzschilde auf maximale leistung! Ausweichkurs!"

          Und hier was meine Spracherkennung verbrochen hat:

          Kirk: (von panik ergriffen) "Computer! Schutz geschildert auf maximale Leistung! Ausser ich kurz!"

          *RUMS*

          Ja, ich fuerchte das war dann das Ende der Enterprise :-(

          Nachdem ich diesen Satz dann trainiert habe, hat er Ihn in mehreren Versuchen zuverlaessig erkannt. Doch Kirk duerfte keine Gelegenheit mehr dazu haben *g*

          *SCNR*

          Gerd

      2. Hallo Wowbagger

        Was meinst du, wie lange man braucht, um die teile so zu trainieren, daß 100% ihre leistungsspanne erreicht werden können (na, hab' ich das jetzt nicht schön ausgedrückt? Hätte glatt von Spock sein können, auch wenn er wohl sicher den begriff "teile" vermieden hätte! *g*)

        100% wirst Du wohl nie erreichen.
        Ich habe Via Voice von IBM und bin trotz Training nie über ca 95 % Erkennung hinausgekommen.

        Gruß
        Jürgen