Tom: HTML Datensuche

Hallo Ihr Lieben,

bevor ich mich jetzt in die xte Erfindung des Rades vertiefe mal kurz gefragt:

Ich habe da ca. 2000 HTML-Seiten, die Adressen und Daten nach einem bestimmten Muster enthalten. Diese Daten muss ich extrahieren.

Wie fang ich ndas am Besten an? Die <td>-Tags zählen? Oder mit einem ereg? Kann man da ggf auch den Browser in Anspruch nehmen und JavaScript?

Was ist am günstigsten?

Irgendwie ist mir bei der Hitze der Plan geschmolzen

LG

Tom

  1. Sup!

    Ich würde ja die "Practical Extraction and Report Language" empfehlen, aber vielleicht geht's ja auch mit einem ereg.

    Gruesse,

    Bio
    --
    PHP - Pubertierende Hauptschüler Programmieren

  2. Hi Tom,
    habe letztens etwas ähnliches gemacht:
    aus einer Textdatei teile ersetzt. Hier ist der Code, vielleicht hilft er:

    <?php
    //Script ersetzt in einer Datei $datei mit der Zeilenanzahl $zeilen
    //$alt durch $neu pro Zeile und überschreibt
    //$datei mit neuen Daten.
    //Sonderzeichen mit \ zB ": "

    //Config:

    $datei   = '';
    $alt  = '';
    $neu  = '';
    $zeilen  = '';

    //Config-Ende

    $datei = fopen($datei, 'a+');

    $i=1;

    while ($zeile = fgets($datei, 1024)) {
     $a = ereg_replace ($alt,$neu,$zeile);

    //Eventuell weiterer String ersetzen ('$alt2', '$neu2', $a)
     $b[$i] = ereg_replace ('','',$a);
     echo $b[$i]."<br>";
     $i++;
    }

    $datei = fopen($datei, 'w+');

    for ($i=0; $i<$zeilen; $i++) {
     fputs ($datei, "$b[$i]");
    }
    ?>