Hello,
da tabellen ja einen wiederkehrenden regelmäßigen aufbau haben, sollte es ausreichen, den quelltext durch einen parser zu jagen. dies könnte ein regex sein, welcher ggfls. angepaßt werden muß.
Das habe ich schon einmal probiert. Aber die Erkennung der Ausnahmeregeln ist recht kompliziert.
Die Satzaufbauten sind leider meistens variant. Natürlich sind Muster vorhanden, sonst würde man die als Mensch ja auch nicht erkennen können und die Straße als Vornamen ansehen (falls Du verstehst, was ich damit meine).
Aber manche Datensätze haben mehrere Ansprechpartner, bei einem steht dann noch die Handy-Nummer dabei, der andere ist mit Adresse, der nächste ohne angegeben usw.
Manchmal sind auch Zusatzinformationen vorhanden...
Wenn es so einfach wäre, wie Du schreibst, hätte ich es schon fertig. Da die Problemlösung aber eher an Petry erinnert, wollte ich das nicht unbedingt selbst erfinden.
Harzliche Grüße aus http://www.annerschbarrich.de
Tom
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau