你好 Christoph,
regelmäßigen Beugungen reicht es einfach bestimmte Endungen zu
streichen. (e, en ,er,...)Das zeig mir doch bitte mal, wie du das machen willst ;-)
wie gesagt, übliche Endungen streichen.
Sorry, aber das halte ich fuer mehr als unrealistisch. Das zu
automatisieren birgt ziemliche Risiken, da muesste man wenn dann schon
von Hand ran.Kleine Argumentationshilfe:
Es gibt tatsächlich Regeln, die es ermöglichen den Wortstamm
herauszufinden.
Das mag vielleicht bei Webseiten gehen, die lediglich natuerliche Sprache
enthalten. Ich bezweifle aber ernsthaft, dass es hier moeglich waere: die
Sprache besteht aus vielen Fachbegriffen und viel Quellcode, den man
tendentiell nicht unterscheiden kann von dem Rest.
[...] Deshalb ist vollständig automatisiertes Stemming ohne Lexikon
nicht möglich.
Sagichdoch! ;-)
再见,
CK
Unsere Vorstellungen von der Ewigkeit sind genauso nuetlich wie die Mutmassungen eines Kuehkens ueber die Aussenwelt bevor es die Eierschale aufbricht.
http://wwwtech.de/