Hi,
Ich meinte damit nicht, dass mir die SelfHTML Suchmaschine in irgendeiner Weise nicht gefällt, sondern dass die für mich angepasste Suchengine wahrscheinlich etwas anders sein müsste (nur vom Erscheinungsbild).
Naja, wie Du das Erscheinungsbild bastelst bleibt natürlich Dir überlassen, das hat jetzt nichts mit dem Problem zu tun, oder stört Dich die Lizenz?
Was genau bedeutet das, dass mti Inverted Index gearbeitet wurde?
Hört sich doll an, ist aber ganz simpel:
Dur klapperst alles Dateien ab, sammelst die darin vorhandenen Wort (behandelst die etwas, z.B. durch tolower(), Stemming o.ä.) und packst alles in eine einzige Liste, in der für jedes Wort das Vorkommen aufgelistet wird. Beispiel:
Datei eins:
"Hallo Erde!"
Datei zwei:
"Hallo Mond?"
Inverted-Index-Datei:
erde: eins
hallo: eins, zwei
mond: zwei
Wenn jetzt z.B. der Suchbegriff "Mond" eingegeben wurde, wird der Inverted-Index nach diesem Wort durchsucht (Das Wort muß natürlich genau so behandelt werden, wie der InvInd erstellt wurde! Hier: tolower()) und in der Spalte drei gefunden. Rechts neben dem Wort stehen alle Dateien, in denen das Wort vorkommt, hier ist es nur eine Datei:"zwei". Ausgabe also "zwei". Suchbegriff: "Hallo", Ausgabe: "eins, zwei". Suchbegriff: "Grmblfz", Ausgabe:"".
Alles klar soweit?
Diese Suche ist zwar sehr schnell, hat aber einige offensichtliche Einschränkungen. Nichts ist eben umsonst ;-)
Es kommt ziemlich auf die Größe Deines Tutorials an, welche Methode (ja, es gibt da noch so einige) anzuwenden ist. Wieviele Dateien hat es denn und wie groß sind die im Schnitt?
so short
Christoph Zurnieden