Hallo Gunnar,
Als was, bitte?
Als Unicode. Also mit entsprechend gewählten Codepoints. Als Abgrenzung zu ASCII oder „klassischen“ 256-er Zeichensatz Codepoints. Die Festlegung eines konkreten Encodings wäre der nächste Schritt.
“Entities encoded in UTF-16 MUST and entities encoded in UTF-8 MAY begin with the Byte Order Mark” [XML §4.3.3]
Ja, und gleich darauf steht
If the replacement text of an external entity is to begin with the character U+FEFF, and no text declaration is present, then a Byte Order Mark MUST be present, whether the entity is encoded in UTF-8 or UTF-16.
Ich hab's nicht verstanden; ich stecke auch nicht in den XML Fachbegriffen drin. Ich weiß nicht mal, was die mit "Replacement Text" oder "Entity" meinen. Und ich habe keine Lust auf mehrere Stunden Spec-Studium, um alle Querbezüge zu verstehen. Deswegen habe ich das ja als Frage aufgeschrieben.
Rolf
sumpsi - posui - obstruxi