Hallo,
» auf jeden Fall vorher atomisieren.
Was meinst du mit atomisieren???
Das sollte eigentlich aus dem weiteren Text des Postings hervorgehen. Bei der Datenmodellierung spricht man von sogenannter "atomistischer Darstellung". Gemeint ist das Aufspalten der Daten in kleinste Entitäten (nicht weiter teilbare Einheiten zusammenhängender Datenzeichen)
Eine Telefonnummer
049 7681 12345-99
lässt sich aufspalten in folgende Entitäten:
Ländervorwahl: 049
(Vorwahlziffer Inlands-Ferngespräch): 0
Ortsvorwahl: 7681
Anschlusskennung: 12345
(Zentraldurchwahl): 1
Durchwahl: 99
Aus den Entitäten ergibt sich der vollständige Datenwert / Schlüssel
Die in Klammern stehenden Entitäten sind in einigen Schlüsseln nicht erkennbar. Die Zusammensetzung / Aufspaltung von Daten in einer Datenbank kann also von bestimmten Bedingungen der Abfrage (Triggern) abhängig sein: Wenn Ländervorwahl leer, leite Ortsvorwahl mit "0" ein. Wenn keine Durchwahl angegeben, ergänze Anschlusskennung mit "1".
Nur das atomistische Modell inclusive der gültigen Regeln garantiert eine konsistente Verarbeitung der Daten. Teilmengen können so immer "richtig" dargestellt werden und führen nicht zu späteren Verarbeitungsfehlern. Insbesondere sortierte Darstellungen von Datenmengen leiden oft unter mangelnder Atomisierung.
Ich hoffe, das einigermaßen verständlich erklärt zu haben.
Grüße
Chris