Joachim: schöne urls auf russisch

Hi,

bin in ein kleines Problem gestolpert: mein cms generiert die Urls aus den Artikelnamen. Bei einer russischen Sprachvariante habe ich jetzt das Problem, dass die kyrillischen Zeichen natürlich ersetzt werden, die Url ist seo-mässig nicht nutzbar. Ich kann allerdings manuell alternative Urls eintragen, dafür habe ich nun erstmal englischen Artikelnamen verwendet.

Ich bin grade ein bisschen verwirrt: ich liege schon damit richtig, dass ich russische Zeichen _nicht_ für eine Url verwenden kann? Kyrillische Zeichen lassen sich auch nicht - analog zu ä = ae - durch lateinische Zeichen ersetzen?

Danke für Aufklärung...

Gruesse, Joachim

--
Am Ende wird alles gut.
  1. Hi,

    bin in ein kleines Problem gestolpert: mein cms generiert die Urls aus den Artikelnamen. Bei einer russischen Sprachvariante habe ich jetzt das Problem, dass die kyrillischen Zeichen natürlich ersetzt werden,

    Ersetzt - durch was?
    Oder meinst du URL-kodiert?

    Ich bin grade ein bisschen verwirrt: ich liege schon damit richtig, dass ich russische Zeichen _nicht_ für eine Url verwenden kann?

    Doch, natürlich kannst du. Allerdings müssen sie nach den üblichen Regeln kodiert werden, um sie auf ASCII abzubilden.

    MfG ChrisB

    --
    RGB is totally confusing - I mean, at least #C0FFEE should be brown, right?
  2. Hi,

    Kyrillische Zeichen lassen sich auch nicht - analog zu ä = ae - durch lateinische Zeichen ersetzen?

    Stichwort: Transliteration; http://de.wikipedia.org/wiki/ISO_9

    MfG ChrisB

    --
    RGB is totally confusing - I mean, at least #C0FFEE should be brown, right?
    1. Hi,

      Stichwort: Transliteration; http://de.wikipedia.org/wiki/ISO_9

      Gutes Stichwort. Ich habs jetzt allerdings urlcodierung getestet, was - wie im anderen Posting beschrieben - das eingesetzte seo-plugin sauber macht, und das sieht erfolgversprechend aus.

      Merci und Gruesse, Joachim

      --
      Am Ende wird alles gut.
    2. @@ChrisB:

      nuqneH

      Kyrillische Zeichen lassen sich auch nicht - analog zu ä = ae - durch lateinische Zeichen ersetzen?

      Stichwort: Transliteration; http://de.wikipedia.org/wiki/ISO_9

      Nein. Nein.

      Zum einen: Warum sollte man Wörter einer Sprache, die üblicherweise in kyrillischer Schrift geschrieben wird, durch lateinische Buchstaben verunstalten?

      Zum anderen hilft das auch nicht wirklich weiter, da bei Transliteration in lateinische Schrift haufenweise diakritische Zeichen auftauchen.

      Qapla'

      --
      Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
      (Mark Twain)
  3. Moin!

    bin in ein kleines Problem gestolpert: mein cms generiert die Urls aus den Artikelnamen. Bei einer russischen Sprachvariante habe ich jetzt das Problem, dass die kyrillischen Zeichen natürlich ersetzt werden, die Url ist seo-mässig nicht nutzbar. Ich kann allerdings manuell alternative Urls eintragen, dafür habe ich nun erstmal englischen Artikelnamen verwendet.

    Komisch, dass die russische Wikipedia sämtliche Artikelseiten mit den russischen Zeichen abbilden kann:

    http://ru.wikipedia.org/wiki/Заглавная_страница

    Wenn das in deinem CMS nicht funktioniert, dann ist dein CMS in diesem Punkt leider als kaputt zu bezeichnen.

    Es ist ein Irrtum, dass URLs ausschließlich ASCII-Zeichen enthalten dürften. Allerdings nicht uncodiert. Und zur Codierung kann man in der URL keine Angaben machen, also gilt hierfür die in der Mehrheit der Browser benutzte Konvention. Und das ist "UTF-8".

    Der Link auf der russischen Wikipediaseite zum Artikel "Wikipedia" sieht z.B. so aus:

    <a href="/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F" title="Википедия">Википедия</a>

    Dieser Link funktioniert, sofern der davon angesprochene Server seinerseits dann auch wieder das richtige damit tut. ASCII ist der kleinste gemeinsame Nenner, das funktioniert überall. Hat aber nichts mit "SEO" oder so zu tun.

    Ich bin grade ein bisschen verwirrt: ich liege schon damit richtig, dass ich russische Zeichen _nicht_ für eine Url verwenden kann? Kyrillische Zeichen lassen sich auch nicht - analog zu ä = ae - durch lateinische Zeichen ersetzen?

    Deutsche Umlaute kann man natürlich auch in URLs benutzen. Muss sie nur entsprechend codieren - was manuell keine sehr angenehme Aufgabe ist. Und serverseitig muss der Request dann auch entsprechend bedient werden. Wenn die URL dabei auf eine als Datei gespeicherte Ressource zeigt, kommt noch das Encoding des Server-Dateisystems ins Spiel. Solche Unwägbarkeiten sind nur schwierig multi-plattform-resistent zu programmieren, weshalb Software um diese Probleme meist einen Bogen macht und eben nur "ASCII" erlaubt. Deshalb "ae" statt "ä".

    - Sven Rautenberg

    1. Moin!

      Komisch, dass die russische Wikipedia sämtliche Artikelseiten mit den russischen Zeichen abbilden kann:

      http://ru.wikipedia.org/wiki/Заглавная_страница

      Wie man sieht, verweigert auch dieses Forum hier den Link zur Startseite... Das ist das Problem des zuständigen Regexes, der Originalzeichen nicht erlaubt (den Link hab ich aus meiner Browserurl-Zeile kopiert, dort aber wurde er "userfreundlich" angezeigt, und nicht im tatsächlichen Original).

      http://ru.wikipedia.org/wiki/Заглавная_страница funktioniert. :)

      - Sven Rautenberg

    2. Servus,

      Komisch, dass die russische Wikipedia sämtliche Artikelseiten mit den russischen Zeichen abbilden kann:

      Das gibt Anlass zur Hoffnung - auch wenn ich nicht wirklich weiss, wie schön ich solche gemischten urls finde ;-)

      Wenn das in deinem CMS nicht funktioniert, dann ist dein CMS in diesem Punkt leider als kaputt zu bezeichnen.

      Das ist wahr. Es ersetzt alle Sonderzeichen aus den Urls und lässt nur Ascii zu. Das muss ich in - deren - Formum mal bemaulen.

      Es ist ein Irrtum, dass URLs ausschließlich ASCII-Zeichen enthalten dürften. Allerdings nicht uncodiert.

      Das seo-Plugin, in dass ich manuell gewünschte Urls eintragen kann, macht in der Tat genau das: es urlcodiert die kyrillischen Zeichen und ersetzt Leerzeichen mit +:

      aus Выходные данные wird dann:
      .../ru/%D0%92%D1%8B%D1%85%D0%BE%D0%B4%D0%BD%D1%8B%D0%B5+%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5

      im Browser schauts wieder so aus:
      .../ru/Выходные+данные

      und das funktioniert mit Server und Software. Nu bin ich platt und muss ein bisschen nachdenken. Auf jeden Fall ist so mein cms nur halbkaputt ;-)

      Danke & Gruesse, Joachim

      --
      Am Ende wird alles gut.
      1. Grüße,

        aus Выходные данные wird dann:

        im Browser schauts wieder so aus:
        .../ru/Выходные+данные

        ich glaube mich zu errinerrn, dass url keine leeruzeichen enthalten dürfen - ist das stuß oder....?
        MFG
        bleicher

        --
        __________________________-

        FirefoxMyth
        1. Hallo,

          aus Выходные данные wird dann:
          .../ru/Выходные+данные

          sieht doch vollkommen richtig aus.

          ich glaube mich zu errinerrn, dass url keine leeruzeichen enthalten dürfen - ist das stuß oder....?

          Das ist richtig - Leerzeichen in URLs müssen als %20 oder als + codiert werden. So wie das im obigen Beispiel ja auch passiert ist.

          Ciao,
           Martin

          --
          Lehrer:  Wieviel ist die Hälfte von 8?
          Schüler: Kommt drauf an. Waagrecht 0 und senkrecht 3.
          Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
          1. @@Der Martin:

            nuqneH

            Das ist richtig - Leerzeichen in URLs müssen als %20 oder als + codiert werden.

            Das ist nicht ganz richtig. Leerzeichen müssen als %20 oder als + in URLs codiert sein.

            Qapla'

            --
            Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
            (Mark Twain)