Harry: Mini-Suchmaschine für Webseite

Beitrag lesen

Tag

Ansatz fehlt? Das ist einfach:

Nein, ist es nicht. Effiziente Such-Algorithmen haben es in sich.

Jeder fängt mal klein an.

Du öffnest das Verzeichnis und liest alle vorhandenen Dateinamen (oder nur
die auf *.html - je nachdem). Dann öffnest du jede gefundene Datei und
liest deren Inhalt ein. Du vergleichst jede Textzeile mit dem Suchwort,
wobei du (Aufgabe für später) natürlich den Text in HTML-Tags nicht suchen
solltest, aber (Aufgabe für viel später) vielleicht die Relevanz von
gefundenen Suchbegriffen innerhalb von <title>, <meta>, <h1..7> oder
sonstigen, von dir als Titel oder Kennzeichnung benutzten Tags erhöhst.

So kann man das machen -- wenn man eine Site von 10 Seiten hat. Wenn man es
jedoch richtig machen will, denkt man sich was vernuenftiges aus.

Richtig ist relativ. Für eine kleine Webseite mit <20 Seiten wäre es totaler Schwachsinn weiß Gott wieviele Stunden in die Entwicklung eines ungeheuer komplizierten und komplexen Suchalgorithmus zu stecken. Noch dazu wo sicher nicht jeder das nötige Know-How hat, um einen solchen Algorithmus zu entwickeln.
Für eine kleine Webseite ist meiner Ansicht nach der von Sven vorgeschlagene Weg durchaus der "richtige".
Für riesen Seiten wäre er natürlich weniger geeignet. Michael hat aber gesagt er will ein einfaches Script, an dem er selber rumfeilen kann - und genauso ist Svens Vorschlag ausgelegt. Schließlich hat er selbst gesagt, daß ihm die Suchalgorithmen die er gefunden hat zu kompliziert sind.

Ich finde diese Aufgabe zum Üben von Perl sehr schön, und durchaus nicht
zuviel.

Ich nicht. Der falsche Ansatz.

Ich schon. In seinem Fall der richtige Ansatz und außerdem die Antwort auf seine Frage.

Ciao,

Harry

PS: Ich habe eine kleine Suchmaschine in PHP programmiert, die genau nach diesem Ansatz arbeitet, in ein paar Stunden, für eine kleine Seite, die sicher nicht groß erweitert wird. Warum soll ich Tage (Wochen ? Monate ? Zeit die ich nicht habe ?) in die Entwicklung eines mordsmäßig komplizierten Algorithmus stecken ?

PPS: Is mir schon klar daß ich sobald die Besucherzahlen in den Himmel steigen und die Suche eine kritische Last für den Server darstellt ein effizienteres Suchsystem brauche. Doch bis dahin ...