Hallo,
kann mir bitte jmd. sagen, wo das spezifiziert ist?
Ich habe z.B. Seiten/Formulare, die mit:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;charset=iso-8859-1">
deklariert sind.
Wenn ich in die Textboxen solcher Seiten Kanjizeichen hineinkopiere bzw. unsere Kollegen in Japan direkt Kanjizeichen eingeben, kommen in der auswertenden Java-Applikation aus dem Request HTML-Entities.
Du meinst, jemand pastet ein ∑ in das Formular und der Browser sendet %26%238721%3B (∑)? Das ist möglich (MSIE) aber nicht standardkonform, also nicht dauerhaft.
Das Problem "FORM submission and i18n", also das Berücksichtigen unterschiedlicher Nutzersprachen und damit unterschiedlicher sprachspezifischer Zeichensätze in Submits von HTML-Formularen, ist nicht trivial (siehe http://ppewww.ph.gla.ac.uk/~flavell/charset/form-i18n.html). Es ist endgültig nur durch die konsequente Nutzung von Unicode zu lösen. Bisher ist es, außer mit enctype="multipart/form-data", _nicht_ lösbar und selbst bei enctype="multipart/form-data" fehlt noch die absolute Browser-Unterstützung (siehe oben angegebenen Link).
Laut HTML4.01-Spezifikation http://www.w3.org/TR/REC-html40/interact/forms.html#h-17.13.4.1 wird ein Formular standardmäßig als "application/x-www-form-urlencoded" submited. Hierfür gilt: "Non-alphanumeric characters are replaced by `%HH', a percent sign and two hexadecimal digits representing the ASCII code of the character." Es können also prinzipiell nur ASCII-Zeichen übertragen werden.
viele Grüße
Axel