Antwort an „Gunnar Bittersmann“ verfassen

@@Rolf B

Als Unicode. Also mit entsprechend gewählten Codepoints. Als Abgrenzung zu ASCII oder „klassischen“ 256-er Zeichensatz Codepoints.

Ach das meinst du. Die Abgrenzung erübrigt sich aber, da der Zeichensatz von XML-Dokumenten (wie auch von HTML-Dokumenten) immer Unicode ist.

If the replacement text of an external entity is to begin with the character U+FEFF, and no text declaration is present, then a Byte Order Mark MUST be present, whether the entity is encoded in UTF-8 or UTF-16.

Ich hab's nicht verstanden

Wie ich das verstehe, ist gemeint: Wenn das Dokument mit dem Zeichen U+FEFF ZERO WIDTH NO-BREAK SPACE beginnt, dann muss ein BOM vorangestellt werden, andernfalls würde ja das U+FEFF als BOM gewertet werden und das Zeichen ZWNBSP nicht mehr vorhanden sein.

Allerdings ist die Verwendung von U+FEFF als ZWNBSP deprecated; für diesen Zweck sollte man stattdessen U+2060 WORD JOINER verwenden. U+FEFF sollte man nur noch als BOM verwenden.

🖖 Живіть довго і процвітайте

--
When the power of love overcomes the love of power the world will know peace.
— Jimi Hendrix
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar

Ihre Identität in einem Cookie zu speichern erlaubt es Ihnen, Ihre Beiträge zu editieren. Außerdem müssen Sie dann bei neuen Beiträgen nicht mehr die Felder Name, E-Mail und Homepage ausfüllen.

abbrechen