Umlaute in Dateinamen
Heizer
- webserver
0 Cheatah0 Auge0 Heizer
Liebes Forum
Ich programmiere ein kleines CMS, in dem die Dateinamen gleich dem Namen des Inhalt sein soll. Wenn ich also eine Datei mit Änderungen habe, dann soll diese auch "Änderungen.html" heißen könne.
Local hat das geklappt, wenn ich die Datei einfach so nenne, den Link auch so nenne, und in der Adresszeile stand das dann URL-encoded (%C3%84nderungen), und die Datei wurde aufgerufen.
(Mozilla 1.8a auf SuSE Linux, PHP 5.02, Apache 2.0.47)
Ich habe das dann auf einen Testserver hochgeladen (Apache 1.3, PHP 4), und da wurden diese Dateien nicht gefunden (404).
Ich dachte mir, gut, dann kodiere ich die Dateinamen halt selbst. Ich habe die Dateien selbst umbenannt in eine rawurl-codierung, und meine Links weißen den kleichen Namen auf. Allerdings verwandelt mein lokaler Server nun die Namen wieder in nochmals kodierte.
Ein ursprüngliches Ä wird also im Dateinamen und Link zu %C3%84, richtig wäre aber dann %25C3%2584, also die %-Zeichen nocheinmal kodiert.
So mache ich das jetzt halt auch, aber mir schwirrt jetzt der Kopf vor lauter Zeichensätzen und automatischen kodierungen.
Könnte mir vielleicht jemand eine Seite empfehlen, die das wirklich gut und ausführlich behandelt? Ich habe das gefühl, daß sich sonst mein Code immer weiter von dem entfernt, was man "gut" nennen könnte.
Vielen Dank
Heizer
Hi,
Local hat das geklappt, wenn ich die Datei einfach so nenne, den Link auch so nenne, und in der Adresszeile stand das dann URL-encoded (%C3%84nderungen), und die Datei wurde aufgerufen.
Dateien kannst Du nennen wie Du willst, sofern es das Filesystem verwalten kann. Die URL - sofern sie dem Dateinamen entsprechen sollte - *muss* jedoch gültig sein, also kodiert. Es ist falsch, sich auf irgendwelche Fehlerkorrekturen einzelner Browser zu verlassen.
Ich habe das dann auf einen Testserver hochgeladen (Apache 1.3, PHP 4), und da wurden diese Dateien nicht gefunden (404).
Korrigiere die URL, probiere es erneut, schaue ggf. ins Logfile, was da eigentlich passiert ist.
Ich dachte mir, gut, dann kodiere ich die Dateinamen halt selbst.
Die Dateinamen brauchen nicht kodiert zu sein, nur die URL.
So mache ich das jetzt halt auch, aber mir schwirrt jetzt der Kopf vor lauter Zeichensätzen und automatischen kodierungen.
Kodiert wird immer an der Stelle, wo Zeichen ungültig sind bzw. eine Sonderbedeutung haben, niemals früher, niemals später.
Cheatah
你好 Cheatah,
Dateien kannst Du nennen wie Du willst, sofern es das Filesystem
verwalten kann.
Das sieht man auch sehr schoen an dem Screenshot hier:
http://www.defunced.de/pics/screenshots/2004-11-18-192007_2560x1024_scrot.png
Da lege ich einen Symlink von /bin/ls an und der Name ist das chinesische
Zeichen fuer »Liste« (名单).
Uebrigens bin ich echt begeistert, wie problemlos das Forum damit klarkommt.
Zahlen 1-10 auf Chinesisch:
一 二 三 四 五 六 七 八 九 十
Das heutige Datum auf Chinesisch:
二陵陵四 年, 十一 月, 十八 日
(2004 Jahr, 11 Monat, 18 Tag)
再见,
CK
Hi,
Uebrigens bin ich echt begeistert, wie problemlos das Forum damit klarkommt.
Zahlen 1-10 auf Chinesisch:
一 二 三 四 五 六 七 八 九 十
ich sehe nur Fragezeichen - muß ich wohl einen chinesischen Zeichensatz installieren, oder?
Aber warum sehe ich neuerdings in Deiner Anrede und hier
再见,
CK
auch nur noch Fragezeichen?
freundliche Grüße
Ingo
hi,
Aber warum sehe ich neuerdings in Deiner Anrede und hier
再见,
CKauch nur noch Fragezeichen?
vermutlich, weil das auch irgendwelche chinesischen schweinereien waren, die er dem Cheatah da an den kopf geworfen hat :-)
gruß,
wahsaga
Hi,
auch nur noch Fragezeichen?
vermutlich, weil das auch irgendwelche chinesischen schweinereien waren, die er dem Cheatah da an den kopf geworfen hat :-)
hmm... aber nicht nur ihm: https://forum.selfhtml.org/?t=94552&m=572433
freundliche Grüße
Ingo
你好 wahsaga,
vermutlich, weil das auch irgendwelche chinesischen schweinereien waren,
die er dem Cheatah da an den kopf geworfen hat :-)
Hehe.
Da faellt mir ein, es gibt im Chinesischen ein Wort-Paar, das klingt genau
so wie “tschuess”. Aber wenn man es uebersetzt, bekommt man als Bedeutung
“Geh sterben” ;-)
Genau so gibt es ein Wort, das fuer ungeuebte Ohren so klingt wie das
italienische “ciao”, aber es ist das ugspr. Wort fuer “ficken” *g*
再见,
CK
hi,
Da faellt mir ein, es gibt im Chinesischen ein Wort-Paar, das klingt genau
so wie “tschuess”. Aber wenn man es uebersetzt, bekommt man als Bedeutung
“Geh sterben” ;-)
wenn einem der gesprächspartner zu sehr auf die nerven geht, ist ja auch letzteres eine passable verabschiedung.
Genau so gibt es ein Wort, das fuer ungeuebte Ohren so klingt wie das
italienische “ciao”, aber es ist das ugspr. Wort fuer “ficken” *g*
in italien sagt man "ciao" ja auch zur begrüßung - und was will der (klischee-)italiener, wenn er eine frau anspricht? na also, da schließt sich der kreis ...
scnr,
wahsaga
你好 Ingo,
ich sehe nur Fragezeichen - muß ich wohl einen chinesischen Zeichensatz
installieren, oder?
Ja, bzw. die entsprechenden Schriften musst du installieren. Unter Windows
geht das z. B. mit dem hier:
http://www.uni-koeln.de/phil-fak/ostas/download/gbfont.exe
http://www.uni-koeln.de/phil-fak/ostas/download/big5font.exe
Dann musst du als Font fuer die Sprache “Traditionelles Chinesisch” den
Font “MingLiU” einstellen, fuer “Chinesisch (GB)” den Font “MS Song” oder
“MS Hei”.
Aber warum sehe ich neuerdings in Deiner Anrede und hier
再见,
CKauch nur noch Fragezeichen?
Weil ich jetzt chinesische Schriftzeichen benutze. Die Begruessung ist in
Pinyin (eine Lautschrift) nǐhǎo (zu dt. so viel wie “Guten Tag” oder
“Wie geht es dir?”), die Verabschiedung ist in Pinyin zài jiàn (zu dt.
soviel wie “Auf Wiedersehen”, “Leb Wohl”).
再见,
CK
Hi,
Ja, bzw. die entsprechenden Schriften musst du installieren.
Naja, soviel wird mir das aber auch nicht bringen. Ob ich nun Fragezeichen oder chinesische Symbole sehe... die Fragezeichen passen da eigentlich schon ganz gut ;-)
freundliche Grüße
Ingo
hi,
Ob ich nun Fragezeichen oder chinesische Symbole sehe... die Fragezeichen passen da eigentlich schon ganz gut ;-)
das würde zumindest mal plausibel erklären, warum so viele leute ihre fragen mit multiplen fragezeichen abschließen - da steckt in wirklichkeit noch eine weitere frage auf chinesisch drin!
gruß,
wahsaga
Hi Christian,
Weil ich jetzt chinesische Schriftzeichen benutze. Die Begruessung ist in Pinyin (eine Lautschrift) nǐhǎo (zu dt. so viel wie “Guten Tag” oder “Wie geht es dir?”)
Ich dachte, dass hieße: "Du gut!"
die Verabschiedung ist in Pinyin zài jiàn (zu dt. soviel wie “Auf Wiedersehen”, “Leb Wohl”).
Schöner fände ich: "Nächsten Himmel wieder gucken!"
Viele Grüße
Mathias Bigge
你好 Mathias,
Weil ich jetzt chinesische Schriftzeichen benutze. Die Begruessung ist
in Pinyin (eine Lautschrift) nǐhǎo (zu dt. so viel wie “Guten Tag” oder
“Wie geht es dir?”)
Ich dachte, dass hieße: "Du gut!"
Nur, wenn man es woertlich uebersetzt ;-)
Wo wir gerade dabei sind: das Wort 好 (Pinyin hǎo) besteht aus zwei
Zeichen: das linke Zeichen bedeutet fuer sich allein “Frau”, das rechte
Zeichen bedeutet “Sohn”. Konklusion: die Frau ist nur dann gut, wenn sie
einen Sohn hat. Ganz schoen Matchohaft, die alten Chinesen ;-)
再见,
CK
Hi,
Wo wir gerade dabei sind: das Wort 好 (Pinyin hǎo) besteht aus zwei
Zeichen: das linke Zeichen bedeutet fuer sich allein “Frau”, das rechte
Zeichen bedeutet “Sohn”. Konklusion: die Frau ist nur dann gut, wenn sie
einen Sohn hat. Ganz schoen Matchohaft, die alten Chinesen ;-)
Die aktuelle chinesische Regierung interpretiert das wohl etwas anders:
Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...
cu,
Andreas
你好 MudGuard,
Die aktuelle chinesische Regierung interpretiert das wohl etwas anders:
Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...
Hehe, das ist wohl besser geworden: inzwischen duerfen sie auch eine
Tochter haben *scnr*
再见,
CK
Hi,
Die aktuelle chinesische Regierung interpretiert das wohl etwas anders:
Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...
Hehe, das ist wohl besser geworden: inzwischen duerfen sie auch eine
Tochter haben *scnr*
Zusätzlich oder stattdessen?
cu,
Andreas
Hi MudGuard,
Die aktuelle chinesische Regierung interpretiert das wohl
etwas anders:
Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...
Hehe, das ist wohl besser geworden: inzwischen duerfen sie auch
eine Tochter haben *scnr*Zusätzlich oder stattdessen?
Gute Frage, ich bin mir jetzt nicht sicher. Min hat mir nur
erzaehlt, dass Maedchen z. B. nicht mehr ausgesetzt werden und es
schon lange nicht mehr so verpoent ist, wie es noch vor 20 (oder so)
Jahren war.
Gruesse,
CK
你好 Ingo,
hier mal ein Screenshot, wie es bei mir aussieht:
http://www.defunced.de/pics/screenshots/2004-11-18-211431_2560x1024_scrot.png
Das hat doch eindeutig einen Coolness-Faktor, oder? ;-))
再见,
CK
Hi,
Das hat doch eindeutig einen Coolness-Faktor, oder? ;-))
zweifellos. Die chinesischen, aber auch die japanischen Schriftzeichen sind sehr dekorativ.
freundliche Grüße
Ingo
Hallo
Wie wär's bei Erstellung der Dateien mit "Ae" statt "Ä" u.s.w.?
Tschö, Auge
Ich danke euch beiden, ich werde wohl nicht darum herumkommen, noch mal über alles drüber zu gehen, aber was solls.
Wenn ich das richtig verstanden habe, dann muß ich einfach nur alle Links encoden, und sonst bleibt alles beim alten, oder?
Das mit den Umlautumwschreibungen habe ich mir auch überlegt, aber die Dateinamen werden aktiv verwendet. Links zu allen Seiten werden automatisch generiert, und der Link auf die Datei "Änderungen" soll eben auch "Änderungen" heißen, nicht "Aenderungen".
Das wäre ja auch nur eine Kodierung, allerdings denke ich, daß das bestehende System mir die weitesten Möglichkeiten läßt, da theoretisch ja jedes UNICODE Zeichen als Name verwendet werden kann (wenn es das Dateisystem erlaubt).
Danke nochmal
Heizer