Herzlicher: Volltextsuche: Diskussion zur Relevanz von Suchergebnissen

Beitrag lesen

Hallo,

ich habe mir eine Volltextsuche auf Basis von PHP und Mysql zusammengebastelt und stehe jetzt vor der Frage, welchem Relevanzkriterium zufolge die Suchergebnisse am besten geordnet ("ranken") werden können.

MySQL bietet hier zwei Möglichkeiten:
1. Wenn man SELECT MATCH(...(Felder)...) Against (...(Suchstring)..) As Relevance ... benutzt, erhält man eine Fließkommazahl Relevance, welche die relative Häufigkeit der Suchbegriffe in den Feldern des Datensatzes wiederspiegelt.
2. Wenn man SELECT MATCH(...(Felder)...) Against (...(Suchstring)... IN BOOLEAN MODE) As Relevance ... verwendet, erhält man eine Zahl x als Relevance, die die wiedergibt, dass die x UND-verknüpften Suchbegriffe des Suchstrings tätsichlich in dem entsprechenden Datensatz enthalten waren. Hat auch noch Suchbegriffe im Suchstring, die nicht enthalten sein müssen (ODER-Verknüpfung), kommen Dezimalzahlen heraus.

Besonders die letzte Methode ist unbefriedigend, da meine Suche eine reine UND-Suche ist und alle Suchergebnisse die Relevanz 2 etwa bekommen, wenn 2 Suchwörter eingegeben wurden.

In diesem Thread möchte ich also gerne eine Diskussion über mehr oder weniger aufwendige Alternativen für ein aussagekräftiges Relevanzranking von Suchergebnissen lostreten.

Über Eure rege Teilnahme würde ich mich sehr freuen.

Herzlichst