@@pl
Das Decomposition_Mapping (lt. UCD) zeigt auf den Codepoint 03A9 ist das die Normalform und wenn ja warum
Ja. Aus demselben Grund, warum Å U+00C5 (lateinisches großes A mit Ring) die Normalform zu Å U+212B (Ångström-Zeichen) ist.
Ja, mit Perl Unicode::Normalize
kann ich z.B. die Normalform NFC erzeugen:
my $string = pack "U", 0x212B;
my $normalized_string = normalize('NFC', $string);
printf "%X", unpack "U", $normalized_string;
und sehe, daß da C5 rauskommt. Meine Frage war, wie ich das anhand der Unicode Character Database nachvollziehen kann.
MfG