你好 Længlich,
Wenn ich Dich richtig verstehe, geht es um den Block "Arabic Presentation Forms-A", der von U+FB50 bis U+FDFF geht.
Jain, es geht um den kompletten Bereich bis U+FFFF; zugegeben, dass U+FFFE und U+FFFF non-characters und nicht erlaubt sind, ist mir klar, BOM und so. Also kann man den Bereich in der Tat einschränken bis U+FDFF
In diesem sind die 32 Codes von U+FDD0 bis U+FDEF als Non-characters definiert; so weit ich weiß für interne Berechnungen von Programmen, die diese ganzen arabischen Ligaturen darstellen.
"These codes are intended for process internal uses, but are not permitted for interchange", steht in http://www.unicode.org/charts/PDF/UFB50.pdf.
Ja, auch das hatte ich bereits herausgefunden. Aber meine Frage war eine ganz andere: warum ist innerhalb dieses Bereichs nur U+FDD0 - U+FDDF „unerwünscht“ in XML/SGML-Dokumenten. Warum nicht die anderen Non-Characters auch? Davon haben wir ja in diesem Bereich genug, z. B. U+FDE0, U+FDED, U+FDEE und so weiter und so fort. Warum ist U+FDD0 - U+FDDF unerwünscht?
再见,
克里斯蒂安
Swen Wacker: Denn wer 'ne Blacklist hat, muss halt daran denken, dass er manches nicht sieht... und vor dem posten die Realitaet einschalten
http://wwwtech.de/