Hallo,
Letztendlich wird es wohl darauf hinauslaufen, dass irgendwer das willkürlich so festgelegt und derartige Codepoints einfach als "ungültig für den Datenaustausch" definiert hat.
Dann ist da aber zweimal Willkür:
Erstens, wieso definiert jemand ab dem Unicode Standard 3.1 plötzlich mitten im BMP die Zeichen von U+FDD0 bis U+FDEF als „noncharacters“. „noncharacters“ sind da ja relativ selten, eigentlich bislang nur U+hFFFE und U+hFFFF (mit h aus 0 bis F) und die nachvollziehbar wegen BOM. Auf der Unicode-Seite und in den Unicode Standards findet sich da nichts außer einem vagen „historical reasons“.
Zweitens, wenn die Third Edition vom XML-Standard zusätzlich die Empfehlung aufnimmt, der Autor solle diese Zeichen wenn möglich nicht verwenden, wieso beschränkt er sich da auf die Zeichen von U+FDD0 bis U+FDDF, wenn doch dieser Block von noncharacters im Unicode-Standard bis U+FDEF weiter geht?
Christian, molily und ich, die wir im Chat darüber gestolpert sind, sind halt noch jung, wir hoffen halt noch auf eine irgendwie nachvollziehbare Logik. ;)
Tim