True: Was ist an Übersetzungssoftware so schwer?

Hallo Forum,

ich frag mich schon seit graumer Zeit, was genau daran so schwer ist, einen (wenigstens annähernd) vernünftigen Übersetzer Englisch/Deutsch zu programmieren.

Natürlich gibt es unzählige Sonderfälle/Feinheiten, usw.

Aber es muss irgendetwas geben, was daran so unglaublich schwer ist, dass es nach meinem Kenntnisstand bisher keinem gelungen ist, unter der Überschrift Übersetzung mehr als eine Spaßmaschine zu generieren.

Woran liegt das?

Gruß

True

  1. Hallo,

    es liegt daran, dass man von eienr Sprache in eine andere nicht 1:1 übersetzen kann. Würde man das programmatisch erfassen wollen, bestünde alles nur aus Sonderfällen, somit sind die Sonderfälle eigentlich die Regel.

    Beispielsweise kannst du auch nicht "Es gibt..." mir "It gives..." übersetzen, da "Es gibt..." im Englischen "There is.." bedeutet. Aber wenn du es schaffst, so einen Übersetzer zu entwickeln, verdienst du den Nobelpreis. :)

    Markus

    1. Hello,

      es liegt daran, dass man von eienr Sprache in eine andere nicht 1:1 übersetzen kann.

      und außerdem fiel mir eben noch ein: man müsste sich, um sowas erfinden zu können, in beiden Sprachen schon mal sehr gut auskennen. Das tut man ja immer dann, wenn man die eine Sprache als Muttersprache und die andere als Vatersprache lernt. Und genau darin liegt doch schon das Problem. Männer kommen vom Mars und Frauen von der Venus. Die verstehen sich also schon grundsätzlich nicht so einfach.

      Wie soll Kollege Computer das unterschwellige, zynische, ehrliche, verlogene, ... nun unterscheiden können?

      :-))

      Liebe Grüße aus dem schönen Oberharz

      Tom vom Berg

      --
      Nur selber lernen macht schlau
      http://bergpost.annerschbarrich.de
      1. Wie soll Kollege Computer das unterschwellige, zynische, ehrliche, verlogene, ... nun unterscheiden können?

        :-))

        Die Weibsbilder sind schuld?
        Ok. DAS erscheint mir logisch. *g* ;-))

        1. 'ǝɯɐu$ ıɥ

          Die Weibsbilder sind schuld?
          Ok. DAS erscheint mir logisch. *g* ;-))

          there are you on the woodway, nuff said.

          ok, back to topic: denk an all die dialekte und sonstigen regionalen besonderheiten. slang und jugendsprache nicht zu vergessen...

          ssnɹƃ
          ʍopɐɥs

          --
          Sleep is a poor substitute for caffeine.
      2. [...] Und genau darin liegt doch schon das Problem. Männer kommen vom Mars und Frauen von der Venus. [...]

        Das mag für unseren Planeten gelten - gibt aber auch andere:
        "women are from Omicron Persei 7, men are from Omicron Persei 9"

    2. Aber wenn du es schaffst, so einen Übersetzer zu entwickeln, verdienst du den Nobelpreis. :)

      Und nicht nur den ;-)

    3. Hi,

      Beispielsweise kannst du auch nicht "Es gibt..." mir "It gives..." übersetzen,

      aber manchmal schon. "Lies das Buch. Es gibt die Antwort ..."
      Was die Sache nicht einfacher macht ...

      cu,
      Andreas

      --
      Warum nennt sich Andreas hier MudGuard?
      O o ostern ...
      Fachfragen per Mail sind frech, werden ignoriert. Das Forum existiert.
  2. Hello,

    ich frag mich schon seit graumer Zeit, was genau daran so schwer ist, einen (wenigstens annähernd) vernünftigen Übersetzer Englisch/Deutsch zu programmieren.

    Natürlich gibt es unzählige Sonderfälle/Feinheiten, usw.

    Aber es muss irgendetwas geben, was daran so unglaublich schwer ist, dass es nach meinem Kenntnisstand bisher keinem gelungen ist, unter der Überschrift Übersetzung mehr als eine Spaßmaschine zu generieren.

    Woran liegt das?

    Fangen wir doch einfach mal mit dem Wort "Spaßmaschine" an. Wie würdest Du das übersetzen?

    http://dict.tu-chemnitz.de/dings.cgi?lang=de&service=deen&opterrors=0&optpro=0&query=Spa�maschine&iservice=&comment=&email=

    ähnliche Wörter: Spülmaschine

    *mmmh* ist auch in Ordnung :-))

    Liebe Grüße aus dem schönen Oberharz

    Tom vom Berg

    --
    Nur selber lernen macht schlau
    http://bergpost.annerschbarrich.de
  3. Hallo,

    ich frag mich schon seit graumer Zeit, was genau daran so schwer ist, einen (wenigstens annähernd) vernünftigen Übersetzer Englisch/Deutsch zu programmieren.

    hast du's denn schon mal probiert? Und sei es nur schematisch?

    Wort für Wort zu übersetzen, ist eine Sache. Das wäre nichts anderes als eine Art Wörterbuch und funktioniert recht gut, wie es z.B. http://dict.leo.org/ oder http://www.dict.cc/ zeigen.

    Einen ganzen Satz zu übersetzen, ist schon *viel* komplizierter. Dazu muss man zunächst den Satz nach seiner Struktur (Grammatik) analysieren und in seine Bausteine zerlegen, Bezüge verschiedener Satzteile erkennen. Das ist nicht trivial.

    Natürlich gibt es unzählige Sonderfälle/Feinheiten, usw.

    Davon wollen wir gar nicht erst reden. Es reicht schon, dass viele Begriffe nur im Kontext richtig übersetzt werden können. Für eine halbwegs brauchbare Übersetzung ist es also notwendig, nicht nur die Wörter und die Grammatik des Satzes zu erkennen, sondern auch die Aussage.

    So long,
     Martin

    --
    Zwei Kumpels sitzen vor dem Computer. "Welche Suchmaschine beutzt du eigentlich meistens?" - "Prima Vera." - "Hmm, kenn' ich gar nicht." Dann geht die Tür auf: "Schatz ich habe deine Sonnenbrille wiedergefunden!" - "Prima, Vera!"
    1. Hello,

      Einen ganzen Satz zu übersetzen, ist schon *viel* komplizierter. Dazu muss man zunächst den Satz nach seiner Struktur (Grammatik) analysieren und in seine Bausteine zerlegen, Bezüge verschiedener Satzteile erkennen. Das ist nicht trivial.

      Insbesondere wenn, der Grammatick und das rechtsschreipung nicht ok sint.

      Liebe Grüße aus dem schönen Oberharz

      Tom vom Berg

      --
      Nur selber lernen macht schlau
      http://bergpost.annerschbarrich.de
    2. Hi Martin.

      Einen ganzen Satz zu übersetzen, ist schon *viel* komplizierter. Dazu muss man zunächst den Satz nach seiner Struktur (Grammatik) analysieren und in seine Bausteine zerlegen, Bezüge verschiedener Satzteile erkennen. Das ist nicht trivial.

      Und wenn es gelingt, ist die Schlacht noch lange nicht gewonnen. Denn die Erzeugung eines korrekten Satzes in einer anderen Sprache mit (annaehernd) gleicher Bedeutung ist auch keineswegs einfach.

      Vor mir liegt zufaellig gerade ein schoener Beispielsatz dazu. Es geht um Sir Walter Scott und das schoene Scott Monument in Edinburgh:

      "His 61-metre monument is the largest to any writer anywhere."

      Eine vernuenftige deutsche Uebersetzung hat im Hinblick auf die Grammatik mit diesem Satz nicht viel gemeinsam.

      Viele Gruesse,
      der Bademeister

  4. Das wesentliche Problem sind normalerweise nicht Sonderfälle oder Feinheiten, denn auch die könnte man ggf. mit zusätzlichen Erläuterungen bzw. Fußnoten abfrühstücken, sondern vielmehr der Kontext.

    Um jedoch den Kontext zu erkennen, bedarf es erheblich mehr als nur einem lexikalischen Parser. Man mehme nur einmal den Begriff "rechte", der in den Kontexten "Jura", "Sitte", "Richtung" und sicher noch einigen mehr vorkommen kann.

    Woran erkennt der menschliche Leser den Kontext? Häufig daher, dass er die Quelle kennt und bereits weiß, worum es geht. Wie willst Du dieses Vorwissen Deiner Software mitgeben?

    Gruß, LX

    --
    RFC 1925, Satz 6a: Es ist immer möglich, einen weiteren Umweg einzufügen.
    RFC 1925, Satz 11a: Siehe Regel 6a
  5. Aber es muss irgendetwas geben, was daran so unglaublich schwer ist, dass es nach meinem Kenntnisstand bisher keinem gelungen ist, unter der Überschrift Übersetzung mehr als eine Spaßmaschine zu generieren.

    Sprache ist mehrdeutig. Gastraum - Gastraum. Eine Übersetzung ist so gut und so unlesbar, wie ihr Versuch, diese Mehrdeutigkeit zu erhalten.

    mfg Beat

    --
    ><o(((°>           ><o(((°>
       <°)))o><                     ><o(((°>o
    Der Valigator leibt diese Fische
    1. Hello,

      Aber es muss irgendetwas geben, was daran so unglaublich schwer ist, dass es nach meinem Kenntnisstand bisher keinem gelungen ist, unter der Überschrift Übersetzung mehr als eine Spaßmaschine zu generieren.

      Sprache ist mehrdeutig. Gastraum - Gastraum. Eine Übersetzung ist so gut und so unlesbar, wie ihr Versuch, diese Mehrdeutigkeit zu erhalten.

      meinten Sie:      Gas|traum ?
      oder meinten Sie: Gast|raum ?

      *grins*

      Liebe Grüße aus dem schönen Oberharz

      Tom vom Berg

      --
      Nur selber lernen macht schlau
      http://bergpost.annerschbarrich.de
      1. Hi,

        Sprache ist mehrdeutig. Gastraum - Gastraum.
        meinten Sie:      Gas|traum ?
        oder meinten Sie: Gast|raum ?

        eben. :-)

        Und darum verschwand der Wachhabende noch einmal schnell in der Wach-
        stube, weil seine Stiefel schmutzig waren, und suchte nach der Wachs-
        tube.

        Ciao,
         Martin

        --
        Datenbanken speichern keine User.
        Das liegt daran, daß Datenbanken mit der Lebensmittelversorgung für gespeicherte biologische Lebensformen derzeit noch Probleme haben.
          (Christoph Schnauß)
        1. Genau darin besteht auch der Nachteil von Sprachausgaben, wenn sie im Nachteilzug sitzen...

          Gruß, LX

          --
          RFC 1925, Satz 6a: Es ist immer möglich, einen weiteren Umweg einzufügen.
          RFC 1925, Satz 11a: Siehe Regel 6a
          1. Genau darin besteht auch der Nachteil von Sprachausgaben, wenn sie im Nachteilzug sitzen...

            ... oder kurz überlegen, ob sie den Hund auf der Straße *um*fahren oder um*fahren*.

            Ciao,
             Martin

            --
            Die letzten Worte des Systemadministrators:
            Nur gut, dass ich ein intaktes Backup habe.
            1. Genau darin besteht auch der Nachteil von Sprachausgaben, wenn sie im Nachteilzug sitzen...
              ... oder kurz überlegen, ob sie den Hund auf der Straße *um*fahren oder um*fahren*.

              Herrscheissahne

              Honi soît qui mal y pense!

              mfg Beat

              --
              ><o(((°>           ><o(((°>
                 <°)))o><                     ><o(((°>o
              Der Valigator leibt diese Fische
              1. Hallo,

                Genau darin besteht auch der Nachteil von Sprachausgaben, wenn sie im Nachteilzug sitzen...
                ... oder kurz überlegen, ob sie den Hund auf der Straße *um*fahren oder um*fahren*.

                Herrscheissahne

                das ist jetzt aber ein kunstvoll konstruiertes Wort - oder gibt's das in der Schweiz?

                Honi soît qui mal y pense!

                "soit" s'écrit sans circonflex, comme je me souviens.

                Ciao,
                 Martin

                --
                Irgendwann in grauer Vorzeit benutzte einer unserer prähistorischen Vorfahren ein Schimpfwort anstelle der Keule.
                Die Zivilisation hatte begonnen.
                1. Herrscheissahne
                  das ist jetzt aber ein kunstvoll konstruiertes Wort - oder gibt's das in der Schweiz?

                  Oh, ab heute gibt's das international ;)
                  Ist aber weiter gebaut von einem Wort, das mich tatsächlich anregte.

                  Ich stolpere immer wieder mal über solche deutschlaunige unglückliche Wortpaarungen, die man dann nie mehr scheiden will.

                  mfg Beat

                  --
                  ><o(((°>           ><o(((°>
                     <°)))o><                     ><o(((°>o
                  Der Valigator leibt diese Fische
  6. Hallo Forum,

    ich frag mich schon seit graumer Zeit, was genau daran so schwer ist, einen (wenigstens annähernd) vernünftigen Übersetzer Englisch/Deutsch zu programmieren.

    Einem Computer das Sprechen und das Verstehen der Sprache beizubringen ist in etwas so schwierig, wie die Struktur des Gehirns zu verstehen: es gibt Keine.

    Das Problem liegt daran, dass eine logische Sprache sehr ineffizient ist. Daher war es evolutionär sehr von Vorteil, diverse Sonderfälle und Kontextinterpretationen einfließen zu lassen.

    Daher fällt es einem Kind, das durch das Gehirn zusätzlich eine unglaubliche Rechenleistung und Speicherkapazität hat, vergleichsweise einfach eine neue Sprache zu lernen.

    Selbst wenn du die Struktur des Gehirns und die entsprechenden Muster verstehen würdest und automatisiert abbilden könntest (ansonsten musst du das manuell machen), bräuchtest du noch sehr viel Zeit und Speicher und Rechenleistung, damit der PC die Sprache erlernt.

  7. Hello,

    aber mal ernsthaft. Es gibt schon Algorithmen, mit denen man eine Sprache in eine andere überführen kann. Das sind dann sicherlich keine xbeliebigen Sprachen, sondern solche, die miteinander verwandt sind. Da gibt es z.B. die erste und zweite Lautverschiebung, die schon sehr viel weiterhelfen können.

    Ein Expertensystem würde sich also auch solcher Kenntnisse bedienen.

    Einen guten (unvollständigen) Überblick über bisher angewandte Verfahren biete Dir, wie mesisten, die Wikipedia: http://de.wikipedia.org/wiki/Maschinelle_Übersetzung

    Liebe Grüße aus dem schönen Oberharz

    Tom vom Berg

    --
    Nur selber lernen macht schlau
    http://bergpost.annerschbarrich.de
  8. Hallo True,

    also wenn Du schonmal aktiv eine Fremdsprache erlernt hast, müsste Dir das eigentlich klar sein. Denn man könnte fast sagen, es gibt mehr oder weniger ausschießlich Sonderfälle ... und ohne den Zusammenhang zu kennen sind Übersetzungen einzelner Wörter kaum möglich. Und wie willst Du nun einer Maschine den kompletten Zusammenhang vermitteln? Wie lange dauert es schon, bis der Mensch eine Fremdsprache wirklich gut erlernt? Vor allem im Erwachsenenalter schaffen es manche nie mehr.

    Ein einfaches Beispiel:
    Die Autos halten an. <-> The cars stop.
    Die Streiks halten an. <-> The strikes are continuing.

    Das Verb "anhalten" bedeuted je nach Zusammenhang genau das Gegenteil.
    Und solche Beispiele gibt es unzählige. Dazu kommt dann aber noch, und das ist noch viel Schwieriger, die Tatsache, dass es viele Wörter und Wendungen in jeder Sprache gibt, die in einer anderen so einfach nicht existieren. So etwas muss dann entweder mit mehreren Sätzen erklärt und umschrieben, oder einfach ausgelassen werden. Das Ganze maschinell zu erledigen, ist mit heute zur Verfügung stehender Rechenleistung wahrscheinlich kaum möglich. Wo doch schon das menschliche Gehirn oft Schwierigkeiten damit hat. Es kann eben doch nicht alles "einfach so" auf 0en und 1en abgebildet werden ;-)

    Lg
    sunny