Der Martin: Anonymisierung von Namen

Beitrag lesen

Hallo,

die Daten sollten in ihrem Ursprungszustand gespeichert werden.

in den meisten Fällen würde ich zustimmen, aber ... Es kommt auf den Zweck an.
Wenn es wirklich nur um eine statistische Auswertung geht -und so habe ich atreiju verstanden- dann ist es nicht notwendig, die Namen im Original zu speichern. Ein Hash, meinetwegen getrennt auf Vor- und Nachnamen, ist ebenso eindeutig wie der Name selbst und kann für statistische Zwecke herangezogen werden.

Nur eins ist dann nicht mehr möglich: Aus 38E2AF70C346D711F64C ablesen, dass "Meier" der häufigste Name ist.

Die Frage ist also tatsächlich: Was soll alles mit den Namen passieren?
Nur eine Zählung? Dann würde ich ein PHP-Array vorschlagen und die Namen als Key verwenden, die Häufigkeit als Wert.

function RegisterName($name, $list)  
 { if (isset($list[$name])  
      $list[$name]++;  
   else  
      $list[$name] = 1;  
 }

So ist jeder Name aus dem Kontext gerissen und damit anonymisiert, erst recht wenn man das tatsächlich nach Vor- und Nachname getrennt zählt.

Hash ist doch schon legalisiert?

Was meinst du damit?

Ciao,
 Martin

--
Most experts agree: Any feature of a program that you can't turn off if you want to, is a bug.
Except with Microsoft, where it is just the other way round.
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(