Hallo Elya, hallo wahsaga
Aber die Algortihmen sind m.W. beide auf englische Texte "optimiert", k.A. was die mit überwiegend deutschsprachigem Input veranstalten würden.
Es gibt da noch dieses Kölner Verfahren, keine Ahnung ob das Verbreitung hat oder was taugt, aber es soll besser auf die deutsche Sprache abgestimmt sein.
Egal welches dieser Verfahren Verwendung finden sollte, sie dürften für den Test auf identische Zitate nicht wirklich geeignet sein.
Sie sind dafür geeignet Worte die im Klang identisch oder sehr ähnlich sind (wie Mayer oder Meier) unabhängig von ihrer Schreibweise miteinander zu vergleichen.
Beim filtern der Zitate dürften weniger unterschiedliche Schreibweisen identischer Zitate das Problem darstellen, als vielmehr absolut identische Aussage trotz unterschiedlicher Wortwahl oder Wortreihenfolge oder unterschiedliche Worte vor oder nach dem eigentlichen Zitat, wie z.B. zitierte Teile des Vorpostings.
Wie sollte der Algorithmus feststellen, was genau der Inhalt des Zitates ist.
Auf Wiederlesen
Detlef
- Wissen ist gut
- Können ist besser
- aber das Beste und Interessanteste ist der Weg dahin!