Tommi: Kyrillische Zeichen in der URL

Moin!

Vorneweg: ich will (zunächst mal) nicht wissen, wie das geht, sondern ob es überhaupt sinnvoll ist!

Es geht darum: der Auftraggeber hat eine normale ASCII-Zeichen-Domain. Darauf soll eine Website in bulgarischer Sprache für Besucher hauptsächlich aus Bulgarien eingerichtet werden. Man könnte nun solche URLs einrichten:

http://example.com/Услуги

Bringt das Probleme mit sich? SEO-mäßig dürfte das doch Vorteile bringen, oder? Ich frage mich aber: Wie tippt man so eine URL ein? Die meisten Besucher dürften zwar eine kyrillische Tastatur haben, aber wie tippen die dann den Domain-Namen ein? Der Auftraggeber konnte mir da auch nicht weiterhelfen, da er schon zu lange in Deutschland lebt.

Tommi

P.S.: dass es so was gibt und es geht, siehe z.B. http://bg.wikipedia.org/wiki/България

  1. Vorneweg: ich will (zunächst mal) nicht wissen, wie das geht, sondern ob es überhaupt sinnvoll ist!
    Es geht darum: der Auftraggeber hat eine normale ASCII-Zeichen-Domain. Darauf soll eine Website in bulgarischer Sprache für Besucher hauptsächlich aus Bulgarien eingerichtet werden. Man könnte nun solche URLs einrichten:

    http://example.com/Услуги

    Bringt das Probleme mit sich?

    Als IRI nicht. Als URI schon.
    Die Betriebssicherheit hängt davon ab, inwiefern beteiligte Prozesse jeweils eine URI nach IRI zur Ansicht und wieder zur URI zum Datenrequest konvertieren.

    SEO-mäßig dürfte das doch Vorteile bringen, oder? Ich frage mich aber: Wie tippt man so eine URL ein?

    Das kommt auf den Useragent an.
    Die Frage ist definiert man eine URI, dann hat sie urlencoded zu erfolgen, also mit percentencoding.
    Definiert man eine IRI, dann definiert man sie in URF-8

    Die meisten Besucher dürften zwar eine kyrillische Tastatur haben, aber wie tippen die dann den Domain-Namen ein?

    In deinem Beispiel geht es gar nicht um Domainnamen, sondern um den Pfad.
    Bei Domainnamen gibt es http://de.wikipedia.org/wiki/Punycode.

    Mein Tipp: Solange verbreitete Software und Webapplicatiionen die korrekte automatische Konversion von IRI nach URI und wieder nach IRI beherrschen, ist es eine schlechte Idee etwas ausser ASCII in Pfaden zu verwenden.

    Was sind IRIs
    http://www.faqs.org/rfcs/rfc3987.html

    Was sind URIs
    http://www.faqs.org/rfcs/rfc3986.html

    mfg Beat

    --
    ><o(((°>           ><o(((°>
       <°)))o><                     ><o(((°>o
    Der Valigator leibt diese Fische
    1. OK, danke für die Infos über IRIs und URIs.

      In deinem Beispiel geht es gar nicht um Domainnamen, sondern um den Pfad.
      Bei Domainnamen gibt es http://de.wikipedia.org/wiki/Punycode.

      Ich meinte: wie tippt man mit einer kyrillischen Tastatur die ASCII-Domain (also z.B. "exmple.com") ein. Der kyrillische Teil dahinter (z.B. "Услуги") dürfte ja mit einer kyrillischen Tastatur kein Problem sein.

      Mein Tipp: Solange verbreitete Software und Webapplicatiionen die korrekte automatische Konversion von IRI nach URI und wieder nach IRI beherrschen, ist es eine schlechte Idee etwas ausser ASCII in Pfaden zu verwenden.

      Du meinst "nicht beherrschen", oder? Was ist mit der Wikipedia? Gibt's da irgendwelche Probleme?

      Tommi

      1. OK, danke für die Infos über IRIs und URIs.

        In deinem Beispiel geht es gar nicht um Domainnamen, sondern um den Pfad.
        Bei Domainnamen gibt es http://de.wikipedia.org/wiki/Punycode.

        Ich meinte: wie tippt man mit einer kyrillischen Tastatur die ASCII-Domain (also z.B. "exmple.com") ein. Der kyrillische Teil dahinter (z.B. "Услуги") dürfte ja mit einer kyrillischen Tastatur kein Problem sein.

        That's non of your Business!

        Was ist mit der Wikipedia? Gibt's da irgendwelche Probleme?

        Nein. Wikipedia verwendet normales Percent-Encoding. Was soll es da für Probleme geben?
        Dass du das nicht _siehst_ hat mit der URI-IRI Konversion durch den Browser zu tun.

        mfg Beat

        --
        ><o(((°>           ><o(((°>
           <°)))o><                     ><o(((°>o
        Der Valigator leibt diese Fische
        1. Nein. Wikipedia verwendet normales Percent-Encoding. Was soll es da für Probleme geben?
          Dass du das nicht _siehst_ hat mit der URI-IRI Konversion durch den Browser zu tun.

          Tatsächlich, im IE steht z.B. http://bg.wikipedia.org/wiki/%D0%91%D1%8A%D0%BB%D0%B3%D0%B0%D1%80%D0%B8%D1%8F in der Adresszeile. Sieht auch nicht so toll aus...

          Tommi

      2. @@Tommi:

        nuqneH

        Ich meinte: wie tippt man mit einer kyrillischen Tastatur die ASCII-Domain (also z.B. "exmple.com") ein. Der kyrillische Teil dahinter (z.B. "Услуги") dürfte ja mit einer kyrillischen Tastatur kein Problem sein.

        Man schaltet die Tastatur um. Genauer: den Tastaturtreiber. Die Beschriftung der Tasten ist für den Computer irrelevant.

        Qapla'

        --
        Alle Menschen sind klug. Die einen vorher, die anderen nachher. (John Steinbeck)