Moin hawkmaster,
Das wäre ja schon mal gut um herauszufinden wenn man solch eine Datei vorliegen hat.
Irrelevant, schieb einfach den String jedesmal durch den Normalizer. Der ist deterministisch.
Was ich nun nicht ganz verstehe: Wie könnte man auf Dateiebene den Dateinamen umwandeln, also dieses
(LATIN CAPITAL LETTER U, U+0055) und ¨ (COMBINING DIAERESIS, U+0308
in
(LATIN CAPITAL LETTER U WITH DIAERESIS, U+00DC)um wandeln?
Wie gesagt, mit der Normalizer-Klasse. Nochmal ein Beispiel:
$var = "Ü"; # LATIN CAPITAL LETTER U WITH DIAERESIS
$var1 = "U\xcc\x88"; # LATIN CAPITAL LETTER U + COMBINING DIAERESIS
echo bin2hex($var), " - ", bin2hex($var1), "\n";
$var = normalizer_normalize($var, Normalizer::FORM_C);
$var1 = normalizer_normalize($var1, Normalizer::FORM_C);
echo bin2hex($var), " - ", bin2hex($var1), "\n";
LG,
CK