Hi,
Mich würden Erfahrungen mit diverser freier Software für eine interne Suchfunktion interessieren. Im Moment fühle ich mich von der riesigen Anzahl von Suchscripts ziemlich erschlagen und wüsste gar nicht recht, wo ich beim Testen anfangen sollte.
Na, soviele gibt es da eigentlich gar nicht. Zumindest nicht, wenn Du etwas vollständiges haben möchtest.
Wichtig wären mir folgende Aspekte:
- (halbwegs) einfache Möglichkeit zur Konfiguration,
Nunja, aufgrund der verlangten Mächtigkeit dürfte das schwierig werden. Aber die mir bekannten Configs sind durch die Bank halbwegs logisch aufgebaut und daher mit relativ wenig Mühe zu konfigurieren.
verständliche Dokumentation
Nicht nur Dokumentation möchtest Du sondern auch auch verständlich? Bei FOSS? >;->
Aber die bekannten Suchmaschinen sind eigentlich recht gut dokumentiert.
- individuell einstellbare Suchfelder, z.B. nach bestimmten Metatags
Das funktioniert mal mehr oder weniger aber leider nirgendwo wirklich komplett. Ist ja auch kein Wunder, da es einfach viel zu viele Protokolle für Metaangaben gibt.
- individuell einstellbare Sektionen der Site
- zeitliche Eingrenzbarkeit der Suche
- diverse Sortierparameter (nach Datum, nach Treffergenauigkeit, Anzahl der angezeigten Suchtreffer, mit oder ohne Beschreibung)
- einstellbare Kriterien zum "Pagerank"
- Boolesche Operatoren, Phrasensuche
Nun, das dürften sie alle haben. mir fällt zumindest jetzt auf Anhieb keine ein, die da deutliche Schwächen zeigen würde.
- Volltextsuche über Indexdatei, möglichst keine Datenbank
Tja, das dürfte ein Problem werden, die wirklich guten arbeiten alle mit DB da sie sonst nicht recht skalieren würden.
Das Script sollte also eine ganze Menge können; ich weiß nicht, ob es das als freie (oder preislich günstige) Software gibt.
Eine Angabe habe ich aber noch vermißt: wofür wird's eigentlich gebraucht? Die Punkte oben sind leider zu allgemein und außer der Google Suchmaschine kann keiner alles aber die dürfte das Budget sprengen (die Kisten gibt's AFAIK ab ~1200 US$)
Die Programmiersprache ist mir eigentlich egal.
Oh? Darf's also auch Javascript sein? ;-)
Beim Suchen bin ich immer wieder auf die folgenden drei Suchprogramme gestoßen:
Swish-e: http://swish-e.org/
Hat eine recht flexible Konfiguration und ist selber auch recht flexibel durch die Einsatzmöglichkeit externer Filter.
ht://Dig: http://www.htdig.org/
Ist "der Standard". Ist jedoch keine freie Software! Interessiert zwar normalerweise nicht, aber es fällt nicht weiter auf und lieber einmal zuviel gewarnt ... ;-)
Perlfect Search: http://www.perlfect.com/freescripts/search/
Ist zwar nicht schlecht, aber ob's den Ansprüchen genügt wage ich zu bezweifeln.
Gibt es gute (bessere) Alternativen?
Selbermachen?
Nein, kein Scherz! Swish-e würde sich dafür z.B. als Basis anbieten. Da die Möglichkeit besteht externe Programme zu nutzen kann da auch mit marginalen Programmierkenntnissen gearbeitet werden. Deren _sehr_ vorsichtiger Hinweis "Swish-e is ideally suited for collections of a million documents or smaller" ist nicht sehr ernst zu nehmen, so schlecht skaliert das Dingen auch wieder nicht. Außerdem soll ja auch nicht mit einer DB gearbeitet werden (warum auch immer).
Ansonsten kann man noch die Suche von http://freshmeat.net/ und http://sourceforge.net/ nutzen und sich da näher umschauen.
Kenntnisse über den genauen Einsatzzweck könnten aber hilfreich sein.
so short
Christoph Zurnieden