@@Rolf B
Als Unicode. Also mit entsprechend gewählten Codepoints. Als Abgrenzung zu ASCII oder „klassischen“ 256-er Zeichensatz Codepoints.
Ach das meinst du. Die Abgrenzung erübrigt sich aber, da der Zeichensatz von XML-Dokumenten (wie auch von HTML-Dokumenten) immer Unicode ist.
If the replacement text of an external entity is to begin with the character U+FEFF, and no text declaration is present, then a Byte Order Mark MUST be present, whether the entity is encoded in UTF-8 or UTF-16.
Ich hab's nicht verstanden
Wie ich das verstehe, ist gemeint: Wenn das Dokument mit dem Zeichen U+FEFF ZERO WIDTH NO-BREAK SPACE beginnt, dann muss ein BOM vorangestellt werden, andernfalls würde ja das U+FEFF als BOM gewertet werden und das Zeichen ZWNBSP nicht mehr vorhanden sein.
Allerdings ist die Verwendung von U+FEFF als ZWNBSP deprecated; für diesen Zweck sollte man stattdessen U+2060 WORD JOINER verwenden. U+FEFF sollte man nur noch als BOM verwenden.
🖖 Живіть довго і процвітайте
When the power of love overcomes the love of power the world will know peace.
— Jimi Hendrix