Martin Rettberg: Anonymisierung von Namen

Beitrag lesen

Hi,

Ich denke, dafür ist eine Hash-Funktion sinnvoll?

jop, echo -n "Hans Müller" | md5sum wird immer den selben Hash erzeugen.
In der Tabelle steht dann allerdings nicht "Hans Müller existiert 20x", sondern "der Hash 977b3b5ffc17536b4f515bb90890df6a existiert 20x".
Beachte auch, dass die kleinste Abweichung (Klein-/Großschreibung, ue statt ü, ...) für einen komplett anderen Hash sorgt.

Gibt es bereits etwas in PHP eingebaut? Oder eine fertige Funktion, die ich dafür nehmen könnte?

Bestimmt.

Martin