Björn Höhrmann: Umlaute in der URL

Beitrag lesen

Ist es möglich Umlaute in der URL zu verwenden?

Nein, die sind nicht zulässig, du musst entweder IRIs einsetzen oder die Umlaute kodieren, letzteres am besten wie für die IRI => URI Transformation vorgeschrieben. Im wesentlichen heisst das, die Zeichensequenz nach Unicode Normalization Format C (NFC) zu normalisieren, als UTF-8 Sequenz abzubilden und dann die entsprechende URI-Kodierung anzuwenden. Das sähe dann z.B. so aus:

http://www.hoehrmann.de/~bj%C3%B6rn/

Der Empfänger muss das dann natürlich unterstützen, sprich, ein Webserver muss annehmen, dass die URI UTF-8 kodierte Zeichen enthalten soll, dementsprechend dekodieren und dann auf das lokale Dateisystem abbilden. Das machen nicht alle...

Man könnte auch andere Zeichenkodierungen verwenden, davon ist aber dringend abzuraten.

Ich würde z.B, gerne "übersicht.php" in die Adresszeile des Browsers schreiben, gibt es eine Möglichkeit das das funktioniert?

Nein, es ist nicht verbindlich vorgeschrieben, wie die Daten an den Server gesendet werden, unterschiedliche Browser schicken in unterschiedlichen Versionen auf unterschiedlichen Plattformen je nach Konfiguration unterschiedliche Daten. Der Trend geht zwar dahin, das wie oben beschrieben (UTF-8) zu implementieren, aber darauf kann man sich nicht verlassen.

Hintergrundinformationen bekommt man z.B. hier:

http://www.w3.org/TR/charmod/
  http://www.ietf.org/internet-drafts/draft-duerst-iri-01.txt
  http://www.w3.org/International/O-URL-and-ident.html

Wo liegt genau das Problem? Bei der Übertragung? Kann man nicht "vorhersehen" was ein Browser aus dem "ü" in der URL macht und das danach wieder entschlüsseln? Mann kann ja dann meinetwegen per Rewrite Rule auf "uebersicht.php" umschreiben!

Du weisst schlicht nicht, was der Browser zu dir schickt, daher kannst du da auch nichts umschreiben.