„discouraged characters“: warum sind welche Zeichen unerwünscht? von Christian Kruse, 10.08.2005 20:11

„discouraged characters“: warum sind welche Zeichen unerwünscht?

Christian Kruse Homepage des Autors 10.08.2005 20:11

你好 Længlich,

Wenn ich Dich richtig verstehe, geht es um den Block "Arabic Presentation Forms-A", der von U+FB50 bis U+FDFF geht.

Jain, es geht um den kompletten Bereich bis U+FFFF; zugegeben, dass U+FFFE und U+FFFF non-characters und nicht erlaubt sind, ist mir klar, BOM und so. Also kann man den Bereich in der Tat einschränken bis U+FDFF

In diesem sind die 32 Codes von U+FDD0 bis U+FDEF als Non-characters definiert; so weit ich weiß für interne Berechnungen von Programmen, die diese ganzen arabischen Ligaturen darstellen.
"These codes are intended for process internal uses, but are not permitted for interchange", steht in http://www.unicode.org/charts/PDF/UFB50.pdf.

Ja, auch das hatte ich bereits herausgefunden. Aber meine Frage war eine ganz andere: warum ist innerhalb dieses Bereichs nur U+FDD0 - U+FDDF „unerwünscht“ in XML/SGML-Dokumenten. Warum nicht die anderen Non-Characters auch? Davon haben wir ja in diesem Bereich genug, z. B. U+FDE0, U+FDED, U+FDEE und so weiter und so fort. Warum ist U+FDD0 - U+FDDF unerwünscht?

再见,
克里斯蒂安

--
Swen Wacker: Denn wer 'ne Blacklist hat, muss halt daran denken, dass er manches nicht sieht... und vor dem posten die Realitaet einschalten
http://wwwtech.de/

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Christian Kruse: „discouraged characters“: warum sind welche Zeichen unerwünscht?

Beitrag lesen

„discouraged characters“: warum sind welche Zeichen unerwünscht?

„discouraged characters“: warum sind welche Zeichen unerwünscht?