„discouraged characters“: warum sind welche Zeichen unerwünscht? von Tim Tepaße, 11.08.2005 04:03

„discouraged characters“: warum sind welche Zeichen unerwünscht?

Tim Tepaße 11.08.2005 04:03

Hallo,

Letztendlich wird es wohl darauf hinauslaufen, dass irgendwer das willkürlich so festgelegt und derartige Codepoints einfach als "ungültig für den Datenaustausch" definiert hat.

Dann ist da aber zweimal Willkür:

Erstens, wieso definiert jemand ab dem Unicode Standard 3.1 plötzlich mitten im BMP die Zeichen von U+FDD0 bis U+FDEF als „noncharacters“. „noncharacters“ sind da ja relativ selten, eigentlich bislang nur U+hFFFE und U+hFFFF (mit h aus 0 bis F) und die nachvollziehbar wegen BOM. Auf der Unicode-Seite und in den Unicode Standards findet sich da nichts außer einem vagen „historical reasons“.

Zweitens, wenn die Third Edition vom XML-Standard zusätzlich die Empfehlung aufnimmt, der Autor solle diese Zeichen wenn möglich nicht verwenden, wieso beschränkt er sich da auf die Zeichen von U+FDD0 bis U+FDDF, wenn doch dieser Block von noncharacters im Unicode-Standard bis U+FDEF weiter geht?

Christian, molily und ich, die wir im Chat darüber gestolpert sind, sind halt noch jung, wir hoffen halt noch auf eine irgendwie nachvollziehbare Logik. ;)

Tim

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Tim Tepaße: „discouraged characters“: warum sind welche Zeichen unerwünscht?

Beitrag lesen

„discouraged characters“: warum sind welche Zeichen unerwünscht?

„discouraged characters“: warum sind welche Zeichen unerwünscht?