ChrisB: Character Encoding - UTF-8 - multibyte String-Funktionen

Beitrag lesen

Hi,

BTW: Ich habe aufgrund dieser Probleme nochmal generell über Sonderzeichen (spez. Umlaute) in der URL nachgedacht. Ist es unter dem Gesichtspunkt der Usability nicht sehr "unfreundlich", denn alle User, die keine dt. Tastatur (bzw. dt. Tastaturlayout) haben, tun sich ja dann sehr schwer mit einer manuellen Eingabe, oder?

Da verweise ich noch mal auf meine Gedanken zum Thema Sonderzeichen in URLs von neulich;
dass man den "Kulturkreis" der potentiellen Besucherschaft dabei nicht ausser Acht lassen sollte, halte ich hier mal als sinnvolle ergänzende Anregung zu diesen Bemerkungen fest, Danke.

Selbst wenn man die alternative Schreibweise (also bspw. "ae" anstelle von "ä") ebenfalls akzeptieren würde (z.B. mit dem rel="canonical" Attribut), müsste der jeweilige User das ja auch erstmal wissen.

Wenn er kein Ä kennt, dann wird er kein Ae dafür schreiben, das ist wohl richtig. Wenn er aber beides nicht kennt, wieso sollte er dann derartiges Interesse an http://example.com/Äbbelwoi haben, dass er diese Adresse aus eigenem Antrieb manuell in die Adresszeile eintippen wird?

Oder kann man durchaus davon ausgehen, dass eh 99,xx% aller Besucher über SuMa- und sonstige Links kommen?

Nimm noch mal das Beispiel aus meinem anderen Gedankengang, http://www.last.fm/music/布袋寅泰 - da bin ich hingekommen, weil ich bei Last.FM nach Tomoyasu Hotei gesucht habe, dem Namen, unter dem ich den Künstler von einer europäischen CD-Veröffentlichung kenne.

布袋寅泰 sind für mich das, was für den Chinesen vielleicht unsere ä, ö, ü und ß wären.
Nein, ich wäre nie darauf gekommen, die selber hinter http://www.last.fm/music/ in der Adresszeile einzutippen - obwohl ich das bei anderen Künstlern mit "westlichen" Namen durchaus öfter mal mache, um schnell auf die entsprechend Artist-Seite zu gelangen.

Ich bin also auch nur durch Nutzung einer Suchfunktion auf diese Seite gekommen.

Der "Wahnwitz" daran ist, dass der Pfadteil nachwievor UTF-8 kodiert ist, aber der Query String dann nicht mehr, sondern wie in diesem Beispiel dann auf einmal in Windows-1252.
[...]
Oder hast du eine Idee/ einen Vorschlag zur Lösung des Problems?

Ja - die "Lösung" für total verkorkste Anfragen lautet: HTTP Statuscode 404.

Irgendwann ist, bei aller Mühe und Liebe, dem Anfragenden nicht mehr zu helfen - und da ist mir dann auch egal, ob das nun mehr an ihm oder dem von ihm verwendeten Client/Browser liegt.

MfG ChrisB

--
Light travels faster than sound - that's why most people appear bright until you hear them speak.