Thomas: HTML Dateien zusammenfassen

Hallo erstmal,
mein Chef hat folgendes Problem und mich damit beauftragt eine Lösung zu finden, nur leider kenne ich mich in der Thematik nicht sonderlich aus, wäre euch also sehr dankbar, wenn ihr eine Idee habt.
Er hat auf seinem Notebook schätzungsweise 80 HTML-Dokumente, in diesen Dokumenten stehen die Kunden samt Adresse und anderen Daten. Er hätte gerne, dass man diese 80 Dokumente irgendwie zusammenfasst. Sprich eine Art Baum, welcher Alphabetisch nach Firmen sortiert ist.

Gibt es da eine Möglichkeit, dies schnell und kompakt zu lösen und es wäre praktisch, wenn dieser Lösungsweg auch berücksichtigt, dass wenn man neue Dateien anlegt, diese dann automatisch in den "Baum" mit eingefügt werden.

Danke im voraus.

Thomas

  1. Hallo Thomas,

    Er hat auf seinem Notebook schätzungsweise 80 HTML-Dokumente, in diesen Dokumenten stehen die Kunden samt Adresse und anderen Daten. Er hätte gerne, dass man diese 80 Dokumente irgendwie zusammenfasst. Sprich eine Art Baum, welcher Alphabetisch nach Firmen sortiert ist.

    Gibt es da eine Möglichkeit, dies schnell und kompakt zu lösen und es wäre praktisch, wenn dieser Lösungsweg auch berücksichtigt, dass wenn man neue Dateien anlegt, diese dann automatisch in den "Baum" mit eingefügt werden.

    Ich glaube, die Aufgabenstellung ist zu individuell um auf ein fertiges Programm zurück greifen zu können. Du musst die HTML-Dateien parsen und die benötigten Informationen (Adressen, etc.) herausfiltern und dann in Baum-Form ausgeben.

    Die konkrete Implementation hängt natürlich davon ab, wie (einheitlich) die HTML-Dokumente aufgebaut sind und nach welchen Kriterien die Daten sich auf die verschiedenen Dateien verteilen. Wodurch sind diese HTML-Dateien denn erzeugt worden?

    Schöne Grüße,

    Johannes

    1. Die konkrete Implementation hängt natürlich davon ab, wie (einheitlich) die HTML-Dokumente aufgebaut sind und nach welchen Kriterien die Daten sich auf die verschiedenen Dateien verteilen. Wodurch sind diese HTML-Dateien denn erzeugt worden?

      Oder poste doch mal eine anonymisierte Beispiel-Datei, wenn alle anderen homogen aufgebaut sind, kann man vieleicht eine Lösung ersinnen.