Reiner: Suchmachinen Programmieren ?

Beitrag lesen

Ich weiss nicht ob die Frage hier richtig aufgehoben ist,
ich frag einfach mal okay ?

Klar!

Ich würde gerne mein Wissen erweitern und lernen wie man eine Suchmachine selber programmiert, und wenns auch nur kleinigkeiten sind ums erstmal auszuprobieren .

Versuche zunächst mal zu verstehen, was eine Suchmaschine eigentlich ist bzw. was sie macht.
Sie besteht ja aus zwei Teilen, dem Roboter/Crawler, der die Seiten erfaßt und der eigentlichen Suchmaschine (was die meisten so darunter verstehen), die eine Datenbankabfrage ermöglicht, um das zu durchforsten, was der kleine, oft wenig beachtete Crawler vorher gefunden hat.

Ich kann Dir nur Tips für Perl geben, aber wie oben angedeutet, ist die Sprache eher zweitrangig!
Zunächst baue etwas, was eine Seite holt. Dann versuche Links aufzulösen, um Dich durch den Seitenbaum zu hangeln.
Das wäre der erste Schritt.

Nächste Überlegung wäre, wie man den Quelltext weiter verarbeitet, d.h. speichert. Sollte man z.B. alle Tags rausschmeißen?
Braucht man eine Datenbank oder reicht (für Versuche) ein Textfile?

Um zu sehen, wie der Crawler Deine Seiten erfaßt, kannst Du Dir mal unsere Kiste ansehen, wie sie nach und nach Seiten erfaßt.
Bei größeren Sites kannst Du das online fast mitverfolgen, bei kleinen ist sie wahrscheinlich fertig, bevor Du Deine Zugangsdaten per Mail erhalten hast.
->http://www.w3sitesearch.de

Gruß
Reiner