MudGuard: input innerhalb form-block

Beitrag lesen

Hi,

ISO-8859-1 hat zwei Definitionslücken, in denen keine Zeichen definiert sind. Die erste beginnt beim Code 0 und endet beim Code 31, dort sind historisch die Steuercodes definiert. Die zweite beginnt beim Code 127 und endet beim Code 159. Siehe auch http://en.wikipedia.org/wiki/ISO_8859-1. Es gibt in ISO-8859-1 also kein Zeichen 156.

Das ist aber vollkommen irrelevant, da der Zeichensatz von HTML-Dokumenten immer ISO10646 (a/k/a Unicode) ist. Auch dann, wenn die Zeichenkodierung ISO-8859-1 ist.
Numerische Zeichenreferenzen beziehen sich NICHT auf die Zeichenkodierung, sondern auf den Zeichensatz.

Zeichen 156 (x9c) ist dort das Steuerzeichen "String Terminator".

Aber davon abgesehen:

Die SGML-Deklaration (Auszug):
CHARSET
          BASESET  "ISO Registration Number 177//CHARSET
                    ISO/IEC 10646-1:1993 UCS-4 with
                    implementation level 3//ESC 2/5 2/15 4/6"
         DESCSET 0       9       UNUSED
                 9       2       9
                 11      2       UNUSED
                 13      1       13
                 14      18      UNUSED
                 32      95      32
                 127     1       UNUSED
                 128     32      UNUSED
                 160     55136   160
                 55296   2048    UNUSED  -- SURROGATES --
                 57344   1056768 57344

sagt, daß die Zeichen von 127 bis 159 ungenutzt sind, œ ist also nicht zulässig.

cu,
Andreas

--
Warum nennt sich Andreas hier MudGuard?
O o ostern ...
Fachfragen unaufgefordert per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.