Michael Schröpl: *.* bei Suche in Webseiten

Beitrag lesen

Die Routine soll alle Seiten zeilenweise nach dem Stichwort durchsuchen und einen Link auf dieselbe generieren, wenn es das Wort in der Seite findet.

Du kannst natürlich eine solche Aktion machen (CPAN-Modul File::Find), aber wie Ludwig empfehle ich Dir, die Seiten statisch zu indexen.

Das Hauptproblem ist dann, wie und wann dieser Index aktualisiert wird.
In diesem Forum hier wird der Index für das Archiv-Suchskript inkrementell erweitert, wenn neu Einträge in das Archiv aufgenommen werden.

Gibt es eine Möglichkeit, zu definieren, dass er ALLE .htm Dateien im aktuellen Verzeichnis abarbeiten soll, ohne daß man alle spezifisch angeben muss?

Wenn Du es selbst programmieren willst:
1. Verzeichnis mit opendir() öffnen,
2. Schleife über alle Einträge,
   pro Treffer: if ($name =~ /-htm$/)
Achtung: Rekursiver Aufruf dieser Funktion für jedes gefundene Unterverzeichnis!

Solche Ansätze sind im Archiv schon ein paarmal beschrieben worden.

Wenn der Begriff gefunden wird, müsste der Pfad für den Link natürlich auch "gemerkt" werden.

Außerdem brauchst Du als globale Variablen das Wurzelverzeichnis und den zugehörigen Wurzel-URL; einen String aus den zwischendurch gefundenen Unterverzeichnissen reichst Du durch die Rekursionsstufen weiter. Daraus kannst Du bei jedem "Blatt" des "Baums" den vollständigen URL und den Pfadnamen zusammenbasteln.