Hallo Forumer
ich beschäftige mich gerade mit verschiedenen Möglichkeiten um eine Suche auf einer Website zu realisieren und habe daher ein paar Fragen:
Generell zur Funktionsweise einer Indexbasierten Suche:
So wie ich es verstanden habe "frisst" sich ein Skript durch die WebSite und baut einen Index mit allen vorkommenden Worten (bzw. erst ab einer Mindestlänge von z.B. 3 Chars), den es in einer DB-Table oder einer TXT-Datei ablegt.
Also z.B.
Apfel -> 1,4
Banane-> 5,6
Baum->1,4,5,6
Haus->2
wobei die Ziffern wiederum IDs einer anderen Table (Seiten-Table) sind wo dann z.B. steht
(ID,URL,Title)
1 -> www.meineSeite.de/apfelbaum.html, Der Apfelbaum
etc.
Die Suchfunktion greift dann zuerst auf die Index-Datei zu und präsentiert dann die Ergebnisse anhand der Seiten-Table.
Frage, habe ich das nicht richtig verstanden, oder liege ich völlig falsch? ;-)
Wenn ich jetzt eine Wichtung einbauen möchte müsste das dann ja ungefähr so aussehen:
Apfel -> 1(10),4(20)
Banane-> 5(4),6(10)
Baum->1(3),4(6),5(8),6(9)
Haus->2(10)
oder besser ?
Apfel -> 1,10
Apfel -> 4,20
Banane-> 5,4
Banae -> 6,10
etc. wobei die zweite Zahl jeweils die Wertigkeit darstellen soll
Da bekomme ich natürlich viel mehr Records als bei Variante 1, welches ist der bessere Ansatz?
Wenn der Content der WebSite schon in einer Datenbank (MySQL) steckt, lohnt es sich dann trotzdem ein extra Skript zu verwenden welches einen Index baut, oder ist MySQL ausreichend schnell, was meint ihr?
Kennt jemand dieses Skript und kann es ggf. empfehlen bzw. davon abraten?
http://www.perlfect.com/freescripts/search
So bevor das hier noch länger wird höre ich lieber auf, da lange Postings doch eher abtörnend sind.
Ich freue mich auf Eure Antworten und auch URLs zu diesem Thema.
Viele Grüße
Euer Dieter