Marc Reichelt: HTML-Parser zum Selberbasteln?

Hi!

Ich habe in der Internet-AG meiner Schule ein Problem:
Unsere Seite enthält viele Dateien, die nicht mehr verlinkt sind, und viele Links, die nicht mehr funktionieren (oder auf Grund von Upload Windows -> Linux wegen der Groß/Kleinschreibung nicht mehr funzen).
Ich will nun in Visual Basic ein Programm schreiben, das alle Seiten (ab einer Startseite) auf Fehler prüft und am Ende alles ausgibt.
Dazu benötige ich einen Parser (in VB), der die HTML-Seiten parsed (damit strukturell für meine Zwecke nutzbar macht), sodass ich z.B. ein Array von allen Links (mit Namen, href usw.), Bildern (IMG-Tags mit SRC usw.) etc. vorliegen habe und ab dem mein Programm mit der Kontrolle beginnen kann.

Wenn ich das Programm fertig habe kann es auch von anderen als Freeware gedownloadet werden (Verbesserungsvorschläge erwünscht).

Marc Reichelt || www.marcreichelt.de

  1. Hi!
    Du kannst den Parser vom IE "mitbenutzen".....
    Schau doch mal hier --> http://codeguru.earthweb.com/vb_internet/htmlparser.html

    Gruß,
    Andi

    1. Moin Moin !

      Muß es VB sein ? Perl hätte zum einen eine Library für HTTP- (und andere) Zugriffe, zum anderen eine Library zum "fachgerechten Zerlegen" von HTML, und zum dritten leistungsstarke Stringbearbeitungsfunktionen.

      Alexander

      --
      <!--#include file="signature.html" -->
      1. Hallo Alexander,

        Muß es VB sein ? Perl hätte zum einen eine Library für HTTP- (und andere) Zugriffe, zum anderen eine Library zum "fachgerechten Zerlegen" von HTML, und zum dritten leistungsstarke Stringbearbeitungsfunktionen.

        Du willst doch den Info-Lehrer nicht überfordern, oder? ;-)

        Grüße,

        Christian

        --
        Sollen sich alle schämen, die gedankenlos sich der Wunder der Wissenschaft und Technik bedienen und nicht mehr davon erfasst haben als eine Kuh von der Botanik der Pflanzen, die sie mit Wohlbehagen frisst.
                              -- Albert Einstein