Hi
[...] Deshalb ist vollständig automatisiertes Stemming ohne Lexikon
nicht möglich.Sagichdoch! ;-)
Soweitwarenwir schon! ;-)
Das teure Lexikon käme aber nur beim archivieren zum zuge. Allerdings müßte man durchrechnen ob der ganze Aufwand überhaupt Performancegewinn bei der Suche brächte ...
Am Rande: Diese ganzen Techniken (stämmen, zusammengesetzte wörter zerlegen, buchstabendreher rausfiltern) werden bei Textanalysen eingesetzt, um den Verwandschaftsgrad zweier Texte anhand gemeinsamer Wörter zu ermitteln.
In der Art: "Suche mir andere Postings zum gleichen Thema"
Tschau
rolf
PS: Ich merke gerade dass ich in Bezug auf Rechtschreibung zu den Topverschmutzern des Forums gehöre...