AndreasW: Warten auf Gom... äh, Mozilla

Beitrag lesen

Hi,

Tach,

Btw: <sing><hüpf> Ich hab Mozi 1.1! Ich hab Mozi 1.1! </hüpf></sing> :-)

Cheatah

P.S.: Wehe, einer sagt was gegen non-ASCII-Zeichen in Elementnamen *g*

In XML dürfen die doch vorkommen? Oder täusche ich mich da?
HTML kann der Schnipsel ja nicht sein, da gibt es weder ein sing- noch ein hüpf-Element...

Ich meine, daß ich, wenn ich das passende Encoding angebe, daß ich dann auch Umlaute benutzen darf.

gucken wir doch mal, denn "glauben" ist "nicht wissen":

[39]    element    ::=    EmptyElemTag
   | STag content ETag [WFC: Element Type Match]
    [VC: Element Valid]

[40]    STag    ::=    '<' Name (S Attribute)* S? '>' [WFC: Unique Att Spec]
[44]    EmptyElemTag    ::=    '<' Name (S Attribute)* S? '/>'

ok, egal ob empty oder nicht, weiter geht es mit "Name"

[5]    Name    ::=    (Letter | '_' | ':') (NameChar)*
[84]    Letter    ::=    BaseChar | Ideographic
[85]    BaseChar    ::=    [#x0041-#x005A] | [#x0061-#x007A] | [#x00C0-#x00D6] | [#x00D8-#x00F6] | [#x00F8-#x00FF] |  ......

gekürzt, da die interessanten Bereiche bereits erwähnt wurden und noch ca. 20 Zeilen dieser Art folgen...

Unter Berücksichtigung von unicode von ü = x00FC darf ü also an erster Stelle vorkommen. Fehlen noch die weiteren Zeichen, dazu müßte ü auch in NameChar vorkommen dürfen:

[4]    NameChar    ::=    Letter | Digit | '.' | '-' | '_' | ':' | CombiningChar | Extender

Da hier wieder Letter erlaubt ist, haben wir gewonnen. Auch an weiteren Positionen darf ü vorkommen.
Auch die übrigen Umlaute (Ä = xC4, Ö = xD6, Ü = xDC, ä = xE4, ö = xF6, ü = xFC) und das scharfe s (ß = xDF) fallen in die erlaubten Bereiche.

Andreas
PS: keine Angst, das hab ich jetzt nicht für Dich getan, sondern weil es mich (anläßlich Deiner Bemerkung) interessiert hat.