你好 MudGuard,
Merkwürdiges Konzept, das an der Zeichenkodierung und nicht auch noch an
der Anwesenheit von bestimmten Zeichen festzumachen, gerade bei
Unicodekodierungen.Ist halt einfacher - die Zeichenkodierung kann nur an 3 Stellen stehen
(HTTP-Header, XML-Deklaration, meta content-type) und muß sowieso
ermittelt werden.
Die Zeichen muessen auch alle ermittelt werden ;-)
Die Anwesenheit bestimmter Zeichen dagegen erfordert komplettes
Durchsuchen des Dokuments - nicht nur nach den Zeichen selbst, sondern
auch nach den Entities und nach den numerischen Zeichenreferenzen ...
Die muessen eh umgeformt werden. Und das Dokument muss eh geparsed werden.
Ist also keine Ausrede.
再见,
CK