Die Satzaufbauten sind leider meistens variant. Natürlich sind Muster vorhanden, sonst würde man die als Mensch ja auch nicht erkennen können und die Straße als Vornamen ansehen (falls Du verstehst, was ich damit meine).
wenn die 'tabelle' keine TABLE TR TD /TD /TR /TABLE - HTML tabelle ist, kann man auch schlecht mit regex arbeiten.
Aber manche Datensätze haben mehrere Ansprechpartner, bei einem steht dann noch die Handy-Nummer dabei, der andere ist mit Adresse, der nächste ohne angegeben usw.
Manchmal sind auch Zusatzinformationen vorhanden...
Wenn es so einfach wäre, wie Du schreibst, hätte ich es schon fertig. Da die Problemlösung aber eher an Petry erinnert, wollte ich das nicht unbedingt selbst erfinden.
dann hilft wohl nur noch, aus den nackten daten etwas sinnvolles zu erkennnen. hierfür die menschlichen entscheidungskriterien als programmlogik einzusetzen scheint tatsächlich etwas aufwendig.