L.Keschka: Unicode

Beitrag lesen

HalloForum-Gemeinde,
beim Surfen zu meinem Arbeitsthema bin ich auf eine US-amerikanische Seite mit german-Anteil gestoßen, auf der die Umlaute nicht richtig dargestellt werden. Und zwar in der Art "m&aumlchtig".... Im sourcecode nachgeschaut, fehlt (scheinbar) jeweils das Semikolon. Angemailt und zurück mit dem Hinweis auf meinen Browser. (Hätte ich auch allein draufkommen können!)
Fürs Tägliche nehme ich den NN 4.6, da sieht man eben die Auswirkungen dieses syntaktischen "Fehlers". Der IE 5.0 hat damit keine Probleme und stellt die Umlaute auch ohne Semikolon richtig dar.
Nun habe ich etwas herumprobiert und festgestellt, der NN (4.6) akzeptiert _nicht_ als Endezeichen vom Unicode die Buchstaben a-z,A-Z und die Ziffern 0-9. Wobei das Semikolon "verschluckt" wird, alle anderen Zeichen (,:-<>äöß....) sind weiterhin Bestandteil des Textes bzw. HTML-Tags.
Ist das schon mal jemandem aufgefallen? Wie heißt die "wissenschaftliche" Erklärung? (Außer - IE ist :-(  )
Ich habe dazu von Zeit zu Zeit im SELFHTML einschließlich seiner Ausleger gestöbert aber nichts gefunden. Wenn doch was drinstehen sollte...
Danke für eine (oder viele) Antwort lkeschka