Doubletten-(Ähnlichkeiten-)Daten-Konsolidierung von Frank (no reg), 21.03.2005 20:14

Doubletten-(Ähnlichkeiten-)Daten-Konsolidierung

Frank (no reg) 21.03.2005 20:14

programmiertechnik

Hi,

abhängig vom Format (ich tipp mal drauf, dass du alles in einer Art Text bekommst) könnte man einen bis x Parser schreiben, die anhand von Tokens arbeiten, Muster in den Quellen abfragen und damit eine Art Liste von verschiedenen Informationstypen erstellen, die bei jedem Parse-Vorgang gegengecheckt wird, wobei dann Ähnlichkeiten entdeckt werden können.

Die geparsten Werte und Informationstypen lassen sich dann - je nach Wunsch - in einer DB oder auch XML-Flatfile persistieren.

Sicher nicht ganz trivial ... wenn ich Zeit hätte, würd ich mich sogar mal an soetwas versuchen.

Aber, genau, beauftrage doch eine nette kompetente Softwarefirma (in D) damit, so sicherst du Arbeitsplätze in Deutschland. ;-)

Ciao, Frank

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Frank (no reg): Doubletten-(Ähnlichkeiten-)Daten-Konsolidierung

Beitrag lesen

Doubletten-(Ähnlichkeiten-)Daten-Konsolidierung

Doubletten-(Ähnlichkeiten-)Daten-Konsolidierung