Gunnar Bittersmann: Umlaute in Dateinamen

Beitrag lesen

@@Rolf B

Wenn der Browser das PDF abholen soll, muss das ü auf jeden Fall URL-codiert sein.

Nö, muss nicht. Die Umwandlung von IRI zu URI machen die Browser schon.

Ob es richtig ist, es UTF-8 zu codieren, ist aber eine andere Frage

Mit Betonung auf „eine“. Die zweite andere Frage ist die nach der Normalisierungsform.

Wenn ich eine lokal (auf macOS) erstellte Datei grüße.html per FTP mit FileZilla auf meinen Webserver schiebe, funktioniert die Verlinkung mit <a href="grüße.html"> nicht. Aber auch nicht prozent-escapet mit <a href="gr%C3%BC%C3%9Fe.html">.

Wenn ich dann aber die Datei auf dem Server mit FileZilla umbenenne in grüße.html (ja, richtig gelesen: ich verwende denselben Dateinamen wieder), dann funktioniert’s – beides.

Das liegt daran, dass ü zunächst decomposed vorlag, d.h. als u gefolgt von U+0301 COMBINING ACUTE ACCENT. Nach der Umbenennung ist es precomposed: U+00FC LATIN SMALL LETTER U WITH ACUTE.

Siehe Spielwiese, auf der ich 2 Dateien grüße.html nebeneinander habe – eine vor der Umbenennung (NFD), eine danach (NFC). Die Dateinamen werden zwar in FileZilla gleich angezeigt, sind aber verschieden, weshalb die Dateien nebeneinander im selben Verzeichnis existieren können.

BTW, die Normalisierung betrifft hier nur das ü, nicht das ß.

🖖 Живіть довго і процвітайте

--
When the power of love overcomes the love of power the world will know peace.
— Jimi Hendrix