Joho,
Du öffnest das Verzeichnis und liest alle vorhandenen Dateinamen (oder nur
die auf *.html - je nachdem). Dann öffnest du jede gefundene Datei und
liest deren Inhalt ein. Du vergleichst jede Textzeile mit dem Suchwort,
wobei du (Aufgabe für später) natürlich den Text in HTML-Tags nicht suchen
solltest, aber (Aufgabe für viel später) vielleicht die Relevanz von
gefundenen Suchbegriffen innerhalb von <title>, <meta>, <h1..7> oder
sonstigen, von dir als Titel oder Kennzeichnung benutzten Tags erhöhst.
So kann man das machen -- wenn man eine Site von 10 Seiten hat. Wenn man es
jedoch richtig machen will, denkt man sich was vernuenftiges aus.
Richtig ist relativ. Für eine kleine Webseite mit <20 Seiten wäre es totaler Schwachsinn weiß
Gott wieviele Stunden in die Entwicklung eines ungeheuer komplizierten und komplexen
Suchalgorithmus zu stecken. Noch dazu wo sicher nicht jeder das nötige Know-How hat, um
einen solchen Algorithmus zu entwickeln.
Noe.
Für eine kleine Webseite ist meiner Ansicht nach der von Sven vorgeschlagene Weg durchaus
der "richtige". Für riesen Seiten wäre er natürlich weniger geeignet. Michael hat aber gesagt er
will ein einfaches Script, an dem er selber rumfeilen kann - und genauso ist Svens Vorschlag
ausgelegt. Schließlich hat er selbst gesagt, daß ihm die Suchalgorithmen die er gefunden hat zu
kompliziert sind.
Es gibt auch einfachere, vernuenftige Algorithmen. Aber der ist nicht unbedingt geeignet, viel zu
viel I/O-Aktivitaet.
Ich finde diese Aufgabe zum Üben von Perl sehr schön, und durchaus nicht
zuviel.
Ich nicht. Der falsche Ansatz.
Ich schon. In seinem Fall der richtige Ansatz und außerdem die Antwort auf seine Frage.
Sehe ich nicht so.
» PS: Ich habe eine kleine Suchmaschine in PHP programmiert, die genau nach diesem Ansatz
arbeitet, in ein paar Stunden, für eine kleine Seite, die sicher nicht groß erweitert wird. Warum
soll ich Tage (Wochen ? Monate ? Zeit die ich nicht habe ?) in die Entwicklung eines
mordsmäßig komplizierten Algorithmus stecken ?
Weil jedes Stueckchen Code in einem beliebigen anderen Zusammenhang wieder auftauchen
kann.
PPS: Is mir schon klar daß ich sobald die Besucherzahlen in den Himmel steigen und die
Suche eine kritische Last für den Server darstellt ein effizienteres Suchsystem brauche. Doch
bis dahin ...
Siehe oben.
Gruss,
CK