crunch: Volltextsuche mit MySQL-Index (DBIx::FullTextSearch)

Beitrag lesen

Hallo zusammen!

Um einen Datenbestand von ca. 10.000 HTML-Seiten zu indizieren, habe ich ein Script geschrieben, das bestimmte, fest definierte Elemente aus den Dateien ausliest (Titel, 1. Überschrift, Datum, Kurztext) und in eine Flat-File-Indexdatei schreibt. Das hat bis jetzt ganz gut funktioniert, mal abgesehen von der etwas lahmen Performance. Allerdings wird die Zahl der Dateien noch weiter ansteigen und dann wäre da noch die Volltextsuche, die ich gerne hätte...

Leider hab ich von Volltextsuchmaschinen praktisch keine Ahnung. Ich hab mir gedacht, dass eine CSV-Datei bei so einer Datenmenge als Index nicht in Frage kommt, also hab ich mich mal in Richtung SQL-Datenbank umgesehen und bin auf das Modul DBIx::FullTextSearch gestoßen. Klingt für meine Zwecke eigentlich ganz gut, da es mir genau die Arbeit abnimmt, von der ich keine Ahnung habe, nämlich die Erstellung des Suchindex. Aber bevor ich mir möglicherweise unnötige Arbeit antue wollte ich mir mal ein paar Meinungen anhören.

Also:
Hat schon mal jemand dieses DBIx::FullTextSearch - Modul benutzt?

Wenn ja, wie sieht es mit der Performance aus?
(Die der Suchabfragen, die Geschwindigkeit der Indizierung und Aktualisierung ist nicht so wichtig)

Wie groß wird die Index-Datenbank?
Eventuell wird das bei einem Provider laufen, hab also nicht unbegrenzt Speicherplatz.

Oder gibt es bessere Möglichkeiten für eine Volltextsuche?
Möglicherweise Eigenbau? Wo gibts Einführungen, Anleitungen, Dokus dazu?
Bin für jeden Link dankbar, bis jetzt hab ich kaum brauchbares Material gefunden, immer nur fertige Scripts, die waren aber meistens nicht für meine Zwecke zu gebrauchen.

Danke schon mal!

Grüße,
Crunch