evi: UTF8 in der URL

Hallo,

ich habe mir mit Modrewrite wunderschöne URL´s gebaut so zb.
http://excample.com/Köln/
beim Surfen klappt auch alles einwandfrei. Nur wenn der Nutzer die URL kopiert und woanders einfügt bekommt er:
http://excample.com/K%C3%B6ln/
Wie kann ich das verhindern? Oder ist das Richtig?

  1. http://excample.com/K%C3%B6ln/
    Wie kann ich das verhindern?

    Verzichte auf Zeichen, die entsprechend URL-Encoded werden müssen.

    Oder ist das Richtig?

    Das ist richtig und technisch notwendig, moderne Browser zeigen einen URL lediglich "schön" an.

    1. @@suit:

      nuqneH

      http://excample.com/K%C3%B6ln/
      Wie kann ich das verhindern?

      Verzichte auf Zeichen, die entsprechend URL-Encoded werden müssen.

      Nein, wieso? Es ging um schöne Adressen: http://excample.com/Köln ist schön, http://excample.com/Koeln ist nicht schön.

      Qapla'

      --
      Alle Menschen sind klug. Die einen vorher, die anderen nachher. (John Steinbeck)
      1. Nein, wieso? Es ging um schöne Adressen: http://excample.com/Köln ist schön, http://excample.com/Koeln ist nicht schön.

        FAIL: bitte RFC 2606 lesen. SCNR

        1. Hallo,

          wie schafft den Wikipedia siene URL:
          http://de.wikipedia.org/wiki/K%C3%B6ln
          nach
          http://de.wikipedia.org/wiki/Köln
          per 301 weiter zu leiten?

          das wäre doch eine riesen htaccess liste oder täusche ich mich da?

          1. wie schafft den Wikipedia siene URL:
            http://de.wikipedia.org/wiki/K%C3%B6ln
            nach
            http://de.wikipedia.org/wiki/Köln
            per 301 weiter zu leiten?

            Beiweise, dass du überhaupt eine URI
            http://de.wikipedia.org/wiki/Köln
            gesendet hast.

            mfg Beat

            --
            ><o(((°>           ><o(((°>
               <°)))o><                     ><o(((°>o
            Der Valigator leibt diese Fische
            1. Beiweise, dass du überhaupt eine URI
              http://de.wikipedia.org/wiki/Köln
              gesendet hast.

              Ich kürze das ab:

              Wenn du /Köln in die Adresszeile deines Browers (als url-path unterhalb einer beliebigen DOmain) notierst, wird dein Client dennoch einen Request auf /K%C3%B6ln absetzen.

              1. Hallo,

                Wenn du /Köln in die Adresszeile deines Browers (als url-path unterhalb einer beliebigen DOmain) notierst, wird dein Client dennoch einen Request auf /K%C3%B6ln absetzen.

                oder /K%F6ln, je nach Konfiguration. AFAIK gibt es keine Vorschrift, wie in der URL eingegebene Nicht-ASCII-Zeichen zu codieren sind, wenn es keinen Kontext (Webdokument) gibt, der eine Codierung vorgibt.

                So long,
                 Martin

                --
                Wer barfuß geht, dem kann man nicht die Schuld in die Schuhe schieben.
          2. (Hallo|(Hi)?(?(-1)(?:ho)?|Ho(, ho){2})|Tag) evi,

            wie schafft den Wikipedia siene URL:
            http://de.wikipedia.org/wiki/K%C3%B6ln
            nach
            http://de.wikipedia.org/wiki/Köln
            per 301 weiter zu leiten?

            das wäre doch eine riesen htaccess liste oder täusche ich mich da?

            Wieso? Für dein Beispiel (deutsches Alphabet) musst du nur die 2 x 7 möglichen Kodierungen übersetzen:
            "Ä", "Ö", "Ü", "ä", "ö", "ü" und "ß" jeweils einmal für UTF-8 und einmal für ISO-Latin-1.

            MwfG
            EisFuX

            1. @@EisFuX:

              nuqneH

              Wieso? Für dein Beispiel (deutsches Alphabet) musst du nur die 2 x 7 möglichen Kodierungen übersetzen:
              "Ä", "Ö", "Ü", "ä", "ö", "ü" und "ß" jeweils einmal für UTF-8 und einmal für ISO-Latin-1.

              Ungenügend. 'é' bspw. kommt auch recht häufig im Deutschen vor.

              Die Beschränkung auf irgendeine Teilmenge von Unicode (oder zumindest der lateinischen Zeichen) ist immer problematisch. Wenigstens Basic Latin (U+0020 bis U+007E), Latin-1 Supplement (U+00A0 bis U+00FF) und Latin Extended-A (U+0100 bis U+017F) sollten vollständig abgedeckt sein.

              Qapla'

              --
              Alle Menschen sind klug. Die einen vorher, die anderen nachher. (John Steinbeck)
  2. ich habe mir mit Modrewrite wunderschöne URL´s gebaut so zb.
    http://excample.com/Köln/
    beim Surfen klappt auch alles einwandfrei. Nur wenn der Nutzer die URL kopiert und woanders einfügt bekommt er:
    http://excample.com/K%C3%B6ln/
    Wie kann ich das verhindern? Oder ist das Richtig?

    Das ist absolut richtig. URIs dürfen nach wie vor nur ein Subset aus den ASCII Zeichen enthalten.
    Im FF-Location gibst du keine URI, sondern eine IRI ein.
    Wenn die IRI navigiert wird, wird sie zu einer URI konvertiert.
    Ebenso wird er im Content bei Copy diese Konversion vornehmen, wenn als Encoding URF-8 Wirksam ist.
    Dieses Verhalten gilt jedoch nicht für alle Browser

    mfg Beat

    --
    ><o(((°>           ><o(((°>
       <°)))o><                     ><o(((°>o
    Der Valigator leibt diese Fische