Sven Rautenberg: schöne urls auf russisch

Beitrag lesen

Moin!

bin in ein kleines Problem gestolpert: mein cms generiert die Urls aus den Artikelnamen. Bei einer russischen Sprachvariante habe ich jetzt das Problem, dass die kyrillischen Zeichen natürlich ersetzt werden, die Url ist seo-mässig nicht nutzbar. Ich kann allerdings manuell alternative Urls eintragen, dafür habe ich nun erstmal englischen Artikelnamen verwendet.

Komisch, dass die russische Wikipedia sämtliche Artikelseiten mit den russischen Zeichen abbilden kann:

http://ru.wikipedia.org/wiki/Заглавная_страница

Wenn das in deinem CMS nicht funktioniert, dann ist dein CMS in diesem Punkt leider als kaputt zu bezeichnen.

Es ist ein Irrtum, dass URLs ausschließlich ASCII-Zeichen enthalten dürften. Allerdings nicht uncodiert. Und zur Codierung kann man in der URL keine Angaben machen, also gilt hierfür die in der Mehrheit der Browser benutzte Konvention. Und das ist "UTF-8".

Der Link auf der russischen Wikipediaseite zum Artikel "Wikipedia" sieht z.B. so aus:

<a href="/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F" title="Википедия">Википедия</a>

Dieser Link funktioniert, sofern der davon angesprochene Server seinerseits dann auch wieder das richtige damit tut. ASCII ist der kleinste gemeinsame Nenner, das funktioniert überall. Hat aber nichts mit "SEO" oder so zu tun.

Ich bin grade ein bisschen verwirrt: ich liege schon damit richtig, dass ich russische Zeichen _nicht_ für eine Url verwenden kann? Kyrillische Zeichen lassen sich auch nicht - analog zu ä = ae - durch lateinische Zeichen ersetzen?

Deutsche Umlaute kann man natürlich auch in URLs benutzen. Muss sie nur entsprechend codieren - was manuell keine sehr angenehme Aufgabe ist. Und serverseitig muss der Request dann auch entsprechend bedient werden. Wenn die URL dabei auf eine als Datei gespeicherte Ressource zeigt, kommt noch das Encoding des Server-Dateisystems ins Spiel. Solche Unwägbarkeiten sind nur schwierig multi-plattform-resistent zu programmieren, weshalb Software um diese Probleme meist einen Bogen macht und eben nur "ASCII" erlaubt. Deshalb "ae" statt "ä".

- Sven Rautenberg