Frank (no reg): Doubletten-(Ähnlichkeiten-)Daten-Konsolidierung

Beitrag lesen

Hi,

abhängig vom Format (ich tipp mal drauf, dass du alles in einer Art Text bekommst) könnte man einen bis x Parser schreiben, die anhand von Tokens arbeiten, Muster in den Quellen abfragen und damit eine Art Liste von verschiedenen Informationstypen erstellen, die bei jedem Parse-Vorgang gegengecheckt wird, wobei dann Ähnlichkeiten entdeckt werden können.

Die geparsten Werte und Informationstypen lassen sich dann - je nach Wunsch - in einer DB oder auch XML-Flatfile persistieren.

Sicher nicht ganz trivial ... wenn ich Zeit hätte, würd ich mich sogar mal an soetwas versuchen.

Aber, genau, beauftrage doch eine nette kompetente Softwarefirma (in D) damit, so sicherst du Arbeitsplätze in Deutschland. ;-)

Ciao, Frank