Hallo Herzlicher,
Ein gängiges Schema, um die Relevanz von Dokumenten bezüglich einer Anfrage zu bewerten ist http://en.wikipedia.org/wiki/Tf–idf@TF-IDF. Neben der Häufigkeit des Suchbegriffes im Dokument wird dort auch die Aussagekraft des Suchbegriffes mit einbezogen. Man benötigt dazu allerdings erstmal einen Textcorpus. Außerdem kann MySQL sowas sicher nicht direkt.
Grüße
Daniel
Könnte man nicht den von Dir angesprochenen Algorithmus sozusagen "prophylaktisch" über alle durchsuchbaren Dokumente drüberlaufen lassen? Und zwar bzgl. der Wörter eines Schlagwortindexes? Und den ermittelten TF-IDF-Wert dann in mySQL separat abspeichern, für jeden Textblock[1]? Also den Suchstring abklopfen auf Vorkommnisse etwaiger Schlagwortindex-Treffer[2], und die jetzt schon eingegrenzte Menge an noch in Frage kommenden Textblöcken in boolescher Art auf das Vorhandensein der "Neben"-Bedingungen[3] testet? Wg.mySQL & direkt weiss ich jetzt nicht genau weiter. Was sind "Closed Procedures" eigentlich genau? Kann man da evtl. eine Funktion mit antriggern, die solche "TF minus IDF" - Algorithmen durchführt? Oder wenigstens sowas Ähnliches was ich da mal angedacht habe jetzt? Fragen über Fragen von meiner Seite aus, leider, voerst.
[1] ...der Textblock XYZ hat folgenden Inhalt: "Ganz arg viel Fachchinesisch...., und der sibirischee Zwergtiger"
[2] Tiger: Zwergtiger, Riesentiger UND(?) "Tiger" in Weltkrieg, 2ter, Panzer
[3] Kampfkraft: Tiger->hoch, Äffchen->niedrig
Best regards
Christian