pl: Unicode Character Database Webservices

Beitrag lesen

problematische Seite

@@pl

Das Decomposition_Mapping (lt. UCD) zeigt auf den Codepoint 03A9 ist das die Normalform und wenn ja warum

Ja. Aus demselben Grund, warum Å U+00C5 (lateinisches großes A mit Ring) die Normalform zu Å U+212B (Ångström-Zeichen) ist.

Ja, mit Perl Unicode::Normalize kann ich z.B. die Normalform NFC erzeugen:

my $string = pack "U", 0x212B;
my $normalized_string = normalize('NFC', $string);
printf "%X", unpack "U", $normalized_string;

und sehe, daß da C5 rauskommt. Meine Frage war, wie ich das anhand der Unicode Character Database nachvollziehen kann.

MfG