Andreas Bierhals: (ZU DIESEM FORUM) Ein Königreich für eine definierte Aufgabenstellung ...

Beitrag lesen

Moin nochmal,

  1. Wie wird eine Suche mit regulären Ausdrücken realisiert? ("LIKE %" kann viel weniger und nutzt zudem den binären Indexzugriff nicht, ist also langsam.)

  2. Wie wird eine Suche nach Teilworten realisiert, die kein Präfix eines Schlagwortes sind?

  3. Wie wird eine Suche nach Phrasen realisiert, die Teilworte enthalten? (Das Verfahren, welches Andreas vorgeschlagen hat, findet m. E. *nicht* die Zeichenkette "efan Mün".)

  4. Wie wird eine Suche nach "intelligenten Umlauten" (Münz => Muenz oder Münz) realisiert? (Das ist ggf. äquivalent zu 1.)

  5. Wie wird eine Suche optional mit oder ohne Berücksichtigtung von Wortgrenzen realisiert?

  6. Wie wird eine Suche optional mit oder ohne Berücksichtung von case-Sensitivität realisiert?

bei der case-Sensitivität könnte man sich noch behelfen, indem alle Begriffe z.B. grundsätzlich nur mit Kleinbuchstaben im Hash abgelegt werden. Auch mit den Umlauten könnte es gehen: Das Suchskript könnte auf Wunsch aus dem Wort "Münz" die Versionen "Münz" und "Muenz" generieren und nacheinander nach beiden Worten suchen. Bei regulären Ausdrücken usw. sehe ich dagegen gewisse <g> Probleme. Auch für die Teilworten kann ich keine schnelle Lösung erkennen. Allerdings schaffen Suchdienste wie Altavista usw. das mit regulären Ausdrücken usw. auch nicht (oder etwa doch??) - möglicherweise muß man hier zwecks besserer Performance einen Kompromiß machen. Ich muß aber auch sagen, daß ich selber das Suchfeature mit den regulären Ausdrücken noch nie benutzt habe, abgesehen davon, daß die  Benutzer der Suchfunktion zu einem vermutlich großen Teil noch nie mit regulären Ausdrücken gearbeitet haben. Bin mal gespannt, was bei der Diskussion letztlich herauskommt...

Bis dannundwann

Andreas