Moin hawkmaster,
es gibt für einige Zeichen mehrere Arten, sie in Unicode darzustellen. Z.B. der Umlaut „Ü“ lässt sich darstellen als
- den den Buchstaben Ü selber (LATIN CAPITAL LETTER U WITH DIAERESIS, U+00DC)
- die Zusammensetzung des Buchstaben U (LATIN CAPITAL LETTER U, U+0055) und ¨ (COMBINING DIAERESIS, U+0308)
Beide sind äquivalent (wenn auch nicht gleich). Die Umformung in eine der beiden Formen für die ganze Zeichenkette nennt man „Normalisierung.“ Was du also willst ist die Normalisierung in eine der Formen – vorzugsweise NFC, wenn du mit Windows arbeitest, da IIRC sowohl OS X als auch Linux damit klarkommen.
In PHP kannst du das, wie bereits erwähnt, mit der Normalizer-Klasse machen.
LG,
CK