ASCII: Suchmaschine - Wie Inhalt in die Db?

Beitrag lesen

Moin

Also ich will eine Suchmaschine programmieren und hänge an folgendem Problem:

Wie krieg ich den Inhalt einer geparsten Seite in die Db?
Ich verwende PHP und MySQL

Ich könnte natürlich alle Dateien über file in ein Array einlesen, aber es muss noch eine andere Methode geben, da diese sehr umständlich wäre

Wie macht das denn Google? Liest bestimmt nicht die Files über file ein, hat ja gar keine Rechte dazu....

Eine Funktion, mit der ich den Inhalt einer geparsten Seite auslesen kann, hab ich nicht gefunden.

Irgendwie sollte es auch gehen, dass ich den Quelltext auslesen kann, denn ich will ja nicht manuell alle Seiten, die indexiert werden sollen, angeben; das Suchscript soll also automatisch allen Links folgen

Also: Wie kann ich das umsetzen?

Thank You!

ASCII