Hmm,
warum quittiert mir der Valligator ein
龜
mitText run is not in Unicode Normalization Form C.
???Es betrifft eine ganze Reihe weiterer Zeichen. Und die Meldung des Valigators liegt darin begründet, daß Unicode kanonisch aufgebaut ist. Für meine Anwendung ist das ohne Belang. MfG
Das war gestern. Meine Anwendung habe ich entsprechend Unicode Standard Annex 15 erweitert, das Decomposition Mapping habe ich so in das Suchergebnis übernommen, daß beim Anklicken eine neue Suche in der Datei UnicodeData.txt stattfindet.
Im Beispiel listed das Suchergebnis alle Zeichen auf, die das COMBINING CARON, Codepoint 030C verwenden.
Es ist von der Handhabe (UX) evnt. noch verbesserungswürdig aber ihr seid ja auch noch da und dürft euren Senf dazugeben 😉
Und jetzt werde ich mal schauen ob CPAN schon ein API für diese Datei UnicodeData.txt hat, vielleicht gibts ja auch einen Webservice vom Konsortium. MfG