@@Christian Kruse
Ne, in diese Richtung funktioniert das schon eine ganze Weile:
Dann verstehe ich nicht, was Hotti da tut:
my $uc = pack "U", 0x1E9E; my $lc = lc $uc;
Macht aus großem ẞ U+1E9E ein kleines ß U+00DF.
use bytes; print "@{[unpack('C*', $lc)]}"; # 195 159
195 159 hexadezimal: C3 9F.
Ah, jetzt verstehe ich. Das sind die Bytewerte von U+00DF in UTF-8. Der Unicode code converter aktualisiert das oberste grüne Feld nicht, was mich in die Irre geführt hatte, dass das die Bytewerte für U+1E9E wären, weil ich ebendas vorher drinstehen hatte.[1]
Hotti hat gezeigt, dass Perl großes ẞ in kleines ß umwandelt. Am Thema vorbei.
Nur halt in die andere Richtung (
ß
zuẞ
, worum es hier ging) nicht.
Eben.
LLAP 🖖
--
“When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory
“When UX doesn’t consider all users, shouldn’t it be known as ‘Some User Experience’ or... SUX? #a11y” —Billy Gregory
Ich hätte schon stutzig werden sollen: für ẞ U+1E9E sollten in UTF-8 nicht nur 2 Byte rauskommen. ↩︎