Gunnar Bittersmann: Probleme mit Sonderzeichen in Verlinkungen

Beitrag lesen

@@Linuchs:

nuqneH

Was sind eigentlich gültige Zeichen in einer Webadresse

Kommt drauf an, was du unter „Webadresse“ verstehst. In einem IRI sind so ziemlich alle Unicode-Zeichen erlaubt.

Technisch sind hier eher URIs von Interesse, deren Syntax im Abschnitt 3 von RFC 3986 beschrieben ist.

Im Pfad sind pchar erlaubt, wobei
pchar       = unreserved / pct-encoded / sub-delims / ":" / "@"
unreserved  = ALPHA / DIGIT / "-" / "." / "_" / "~"
pct-encoded = "%" HEXDIG HEXDIG
sub-delims  = "!" / "$" / "&" / "'" / "(" / ")" / "*" / "+" / "," / ";" / "="

und warum betrachtet Sylpheed gewisse Zeichen, auch Umlaute, als Ende-Angabe?

Weil die in einem URI nicht vorkommen dürfen.

Sonderzeichen mit kryptischen %nn zu codieren, ist ja noch schlimmer.

Nein. Zeichen mit Sonderbedeutung in einem bestimmten Kontext zu escapen, ist nicht schlimm, sondern völlig normal.

Und es stört auch nicht. Der Nutzer bekommt davon u.U. gar nichts mit.

Wenn im Quelltext <a href="[link:http://example.org/%C3%9CTF-8@title=http://example.org/%C3%9CTF-8]">ÜTF-8</a> steht, zeigt der Browser in der Statuszeile „example.org/ÜTF-8“ an. Und nach dem Folgen des Links auch in der Adresszeile. Die Umwandlung URI–IRI läuft im Hintergrund.

Der Nutzer bekommt die prozent-codierten Zeichen nicht zu sehen. Soll er auch nicht.

Qapla'

--
„Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)