Hallo,
http://www.w3.org/TR/html4/interact/forms.html#h-17.13.3.4, ab dort nach CR LF suchen (kommt 2mal)
Den hatte ich ja schon. Mir fehlt der Bezug zur RFC.
Das x in application/x-www-form-urlencoded sagt, dass das ein nicht offiziell vergebener MIME-Typ ist; insofern ist die HTML-Spezifikation ausschlaggeben. HTTP selber gibt CR LF nur für Header, nicht für den Body einer HTTP-Nachricht vor. Und banal sagt HTML 4 nur, dass man Prozent-Kodierung wie bei IRIs/URIs gelten soll; neuere RFCs für URIs/IRIs geben letztendlich nur mehr vor, dass UTF-8 als Oktett-Format für die Prozent-Kodierung gewählt werden soll, wenn man nicht mit Legacy-Zeugs kümpft, früher war das unspezifiziert. Es gibt keine Aussage über den Zeilenumbruch; das kommt aus HTML 4. HTML 5 wird da expliziterer:
“Replace every occurrence of a U+000D CARRIAGE RETURN (CR) character not
followed by a U+000A LINE FEED (LF) character, and every occurrence of a U+000A
LINE FEED (LF) character not proceeded by a U+000D CARRIAGE RETURN (CR)
character, by a two-character string consisting of a U+000D CARRIAGE RETURN -
U+000A LINE FEED (CRLF) character pair.”
Tim