Clemens : KSearch von www.kscripts.com

Beitrag lesen

Hi Michael!

* boolesche Verknüpfungen
  * wildcard

das halte ich für die beiden anspruchsvollsten Teile
der Aufgabenstellung. Wie wichtig sind die?

Naja, wenn man schon mal die Sachen eingesetzt hat möchte man sie nicht mehr missen ;-) Wobei das mit den wildcards nicht unbedingt sein muss, da man sie sowieso meist am Anfang oder Ende eines Suchbegriffs nutzt, wenn das Script die Suche nach ganzen Wörtern vs. Wortteilen unterstützt reicht das auch.

Dafür fehlen Angaben über den Preis ebenso wie über
die Menge der zu verarbeitenden Daten ...

Open Source, wenn möglich, man hat ja immer irgendwelche Kleinigkeiten, die einem nicht passen und an denen man selbst noch herumschrauben will. Die von Dir unten genannten 10.000 Dokumente reichen locker. Wobei man sich - wie ich gerade festgestellt habe - da auch leicht verschätzt, wenn man mal in /Apache/htdocs schaut, ist doch 'ne ganze Menge, dazu kommt ja - wenn die Anfrage über http kommt noch etwas aus der Datenbank... aber 5.000 bis 10.000 Dokumente würden reichen.

Was bei mir bisher in die engere Auswahl kam

Aus eigener Erfahrung würde ich noch FDSE dazu nehmen:
   http://www.xav.com/scripts/search/
Solange Du den Copyright-Vermerk nicht entfernen
willst, ist das Freeware; ob der Crawler via HTTP
oder Dateizugriff arbeitet, ist einstellbar (beides
macht Sinn in dem entsprechenden Kontext). Mehr als
10000 Dokumente sollten es aber eher nicht sein, weil
FDSE so ähnlich arbeitet wie die Self-Archivsuche.

Danke für den Hinweis, werde ich mir mal anschauen.

Clemens