Ich habe folgende Aufgabe:
Ein beliebiger Fließtext maximal 1000 Wörter, inkl. Kommas etc., soll verglichen werden mit einer Kategorienliste (diese besteht aus 500 Kategorien die in einer mysql Datenbank gespeichert werden. Mein erster Ansatz ist der.
- Ich nehme den Fließtext, zerlege ihn in ein Array.
- Lösche Satzzeichen und Leerzeichen
- Lösche alle doppelten Einträge.
- Lösche alle Begleitworte, wie der, die, das, wer und etc.
Dann habe ich das Ganze mit eine Test/Beispiel Fließtexten mit 1000 Wörtern getestet Im Durchschnitt blieben dann aus einem Text von 1000 Wörter ca. 50 Prozent über. Was aber immer noch 500 Wörter sind. Jetzt würde ich über eine SELECT Abfrage die gefilterten Wörter mit der Kategorienliste vergleichen.
Mein großes Bedenken ist aber, das ich für jede Kategorie eine SELCT Abfrage starten muss, also 500 hintereinander? Ich weiß nicht ob das die Lösung ist? Meine Frage nun, und Bitte an die Intelligenz und den Einfallsreichtum des verschiedenen Kreativen Menschen.
Kann ich die SELCT Abfragen vereinfachen, zusammenfassen, oder gibt es gar einen anderen besseren Ansatz um diese Aufgabe zu bewältigen.