Hi Philipp,
So! WELCHE Wörter nimmt man denn da. Alle? Und wann nehme ich Wortkombinationen?
Ähm, das hängt von dir ab :-)
- Wortkombinationen kommen sehr selten vor. Ich würde dir der einfachheitshalber eine
"Einwortindexierung" vorschlagen.
Man nimmt Wortkombinationen, wenn die Aufgabenstellung es verlangt. ;-)
Eine Volltextsuche wie im Self-Portal ist mit einer reinen Indexsuche nur sehr schwierig performant umzusetzen.
ist denn ein assoziatives Array aus Sicht einer Programmiersprache auch 'vorsortiert'?
Nein. Ein assoziatives Array ist eigentlich immer unsortiert, da die Keys eine Menge und
kein Array sind. Aber: in den meisten 4GL Languages (PHP/Perl/...) kommen hashing-
Algorithmen zum Einsatz, sodass ein Eintrag dennoch sehr schnell gefunden werden kann.
nicht "dennoch", sondern vielmehr "dadurch".
(Hashing ist üblicherweise _schneller_ als der rekursive Abstieg in einem sortierten Baum.)
Spricht etwas dagegen den Volltextindex von MySQL (Achtung: Version beachten!) zu
verwenden?
Ja. ;-) Es erzwingt eine Mindestlänge des Suchbegriffs und verwendet eine fest eingebrannte Stopwortliste. Ich mußte beides im C-Quelltext von mySQL ändern, um diese Funktion so verwenden zu können, daß sie meine Anforderungen erfüllte.
Viele Grüße
Michael
T'Pol: I apologize if I acted inappropriately.
V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
(sh:| fo:} ch:] rl:( br:^ n4:( ie:% mo:) va:| de:/ zu:| fl:( ss:) ls:~ js:|)
Auch diese Signatur wird an korrekt konfigurierte Browser gzip-komprimiert übertragen.