Tim Tepaße: „discouraged characters“: warum sind welche Zeichen unerwünscht?

Beitrag lesen

Hallo,

Letztendlich wird es wohl darauf hinauslaufen, dass irgendwer das willkürlich so festgelegt und derartige Codepoints einfach als "ungültig für den Datenaustausch" definiert hat.

Dann ist da aber zweimal Willkür:

Erstens, wieso definiert jemand ab dem Unicode Standard 3.1 plötzlich mitten im BMP die Zeichen von U+FDD0 bis U+FDEF als „noncharacters“. „noncharacters“ sind da ja relativ selten, eigentlich bislang nur U+hFFFE und U+hFFFF (mit h aus 0 bis F) und die nachvollziehbar wegen BOM. Auf der Unicode-Seite und in den Unicode Standards findet sich da nichts außer einem vagen „historical reasons“.

Zweitens, wenn die Third Edition vom XML-Standard zusätzlich die Empfehlung aufnimmt, der Autor solle diese Zeichen wenn möglich nicht verwenden, wieso beschränkt er sich da auf die Zeichen von U+FDD0 bis U+FDDF, wenn doch dieser Block von noncharacters im Unicode-Standard bis U+FDEF weiter geht?

Christian, molily und ich, die wir im Chat darüber gestolpert sind, sind halt noch jung, wir hoffen halt noch auf eine irgendwie nachvollziehbare Logik. ;)

Tim