你好 LanX!,
Zusammen mit Variablennamen etwa 50%, wuerde ich vermuten, wenn nicht
mehr.hmm ... ich denke auch bei Variablennamen kommt nicht jede Permutation
gleich häufig vor, weil man sie schließlich ja auch aussprechen möchte.
Ich habe noch nie meine Variablen-Namen auf aussprechbarkeit hin
gewaehlt, krkr. Du kannst nicht automatisch von dir auf andere schliessen.
Die "Korrekturkollisionen" werden dann auch nachträglich aufgelöst,
d.h. sofern gewollt (das erlaubt ansonsten eine Ähnlichkeitssuche)Beispiel:
|goggle(Rechtschreibfelher)| = 96
|goggle(Rechtschreibfehler)| = 403.000Das wuerde aber bedeuten, dass man wieder eine nachgeschaltete
Volltext-Suche machen muss. Doof, damit wuerde man alles wieder
verschenken.naja, wie bei Danielas Phrasensuche auch hängts davon ab wie teuer
der Zugriff auf Michaels Vollindex ist, dort wo sie auch ihre
"Kollisionen" auflöst.
Daniela muss doch gar keine Kollisionen aufloesen, Mooeensch ;-) Da wird
exakt gematcht. Bei Daniela geht es um eine eventuelle anschliessende
Phrasensuche.
regelmäßigen Beugungen reicht es einfach bestimmte Endungen zu
streichen. (e, en ,er,...)Das zeig mir doch bitte mal, wie du das machen willst ;-)
wie gesagt, übliche Endungen streichen.
Sorry, aber das halte ich fuer mehr als unrealistisch. Das zu
automatisieren birgt ziemliche Risiken, da muesste man wenn dann schon
von Hand ran.
Und lange wörter sollten zerlegt werden.
Damit machst du die Eingangsmenge aber noch groesser.
Hä? Die Menge der Wörter im Index werden kleiner wenn die
Zusammengesetzten wegfallen!Du hast von langen Woertern, nicht von zusammengesetzten Woertern
geredet.Stimmt, aber wieso wird die Eingangsmenge größer wenn die "längeren"
wegfallen? >:)
Weil du aus einem Wort n Worte machst. Also z. B. Kunstwort
Ichbineingrossermensch, ein einziges Wort. Daraus machst du (willkuerlich)
3 Worte. Und schon hast du die 3-fache Menge in der Eingabemenge.
再见,
CK
Auf der ganzen Welt gibt es nichts Weicheres und Schwaecheres als Wasser. Doch in der Art, wie es dem Harten zusetzt, kommt nichts ihm gleich.
http://wwwtech.de/