ASCII: Suchmaschine - Wie Inhalt in die Db?

Moin

Also ich will eine Suchmaschine programmieren und hänge an folgendem Problem:

Wie krieg ich den Inhalt einer geparsten Seite in die Db?
Ich verwende PHP und MySQL

Ich könnte natürlich alle Dateien über file in ein Array einlesen, aber es muss noch eine andere Methode geben, da diese sehr umständlich wäre

Wie macht das denn Google? Liest bestimmt nicht die Files über file ein, hat ja gar keine Rechte dazu....

Eine Funktion, mit der ich den Inhalt einer geparsten Seite auslesen kann, hab ich nicht gefunden.

Irgendwie sollte es auch gehen, dass ich den Quelltext auslesen kann, denn ich will ja nicht manuell alle Seiten, die indexiert werden sollen, angeben; das Suchscript soll also automatisch allen Links folgen

Also: Wie kann ich das umsetzen?

Thank You!

ASCII

  1. Hi,

    Wie krieg ich den Inhalt einer geparsten Seite in die Db?

    mittels INSERT INTO.

    Ich könnte natürlich alle Dateien über file in ein Array einlesen, aber es muss noch eine andere Methode geben, da diese sehr umständlich wäre

    HTTP-Requests, die natürlich grundsätzlich um einiges umständlicher sind als simple Dateizugriffe.

    Wie macht das denn Google?

    Mit HTTP-Requests. Genau wie jeder andere HTTP-Client.

    Cheatah

    --
    X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. Hi,

      Wie krieg ich den Inhalt einer geparsten Seite in die Db?

      mittels INSERT INTO.

      Das weiß ich auch
      Es geht um das Auslesen, nicht um das einfügen, na gut, falsch gefragt

      Ich könnte natürlich alle Dateien über file in ein Array einlesen, aber es muss noch eine andere Methode geben, da diese sehr umständlich wäre

      HTTP-Requests, die natürlich grundsätzlich um einiges umständlicher sind als simple Dateizugriffe.

      Wie macht das denn Google?

      Mit HTTP-Requests. Genau wie jeder andere HTTP-Client.

      Und wie genau funktioniert das?

      Cheatah

      1. Googeln, SelfHTML-Suche nutzen... so geht das.

        mfg q

        1. Googeln, SelfHTML-Suche nutzen... so geht das.

          Ja nach was soll ich denn suchen?

          1. q gfm,

            Ja nach was soll ich denn suchen?

            Mit HTTP-Requests. Genau wie jeder andere HTTP-Client.

            Danach?

            mfg q

      2. Hallo,

        Es geht um das Auslesen, nicht um das einfügen, na gut, falsch gefragt

        Wie macht das denn Google?
        Mit HTTP-Requests. Genau wie jeder andere HTTP-Client.
        Und wie genau funktioniert das?

        Lies Dir http://de3.php.net/manual/de/function.file.php noch mal _ganz_ genau durch, auch die Kommentare und dann http://de3.php.net/manual/de/function.fsockopen.php.

        viele Grüße

        Axel