Hello out there!
(de, en, fr, it, pt, etz)
etz?? Solch Sprachkürzel gibt es nicht. Wofür sollte das stehen?
Nun soll z.B. Russisch oder Griechisch dazu kommen. Beides Sprachen mit Kyrillischen Zeichen.
Nö, Griechisch wird mit griechichen Buchstaben geschreiben. Das kyrillische Alphabet basiert auf dem griechischen. [Wikipedia]
Die Westlichen Sprachen konnte ich ganz einfach vie Textfeld einlesen und dann alle Sonderzeichen mittels htmlentities() <PHP> in &...; umwandeln.
Eine Umwandlung in Zeichen-Entity-Referenzen ist nicht nötig, wenn eine Zeichencodierung verwendet wird, mit der sich die benötigten Zeichen codieren lassen. Für die meisten westeuropäische Sprachen sollte es ISO 8859-1 tun.
Mit den Östlichen Sprachen geht das irgend wie nicht.
Für die in osteuropäischen Sprachen mit lateinischer Schrift benötigten „Sonderzeichen“ gibt es keine Entities; in HTML wurde bspw. keine Entity 'aogonek' für das Zeichen 'ą' oder 'ccaron' für 'č' definiert.
Für kyrillische Zeichen gibt es auch keine Entities; wohl aber für die griechischen. [SELFHTML]
Kann mir da jemand ein paar Tipps geben, worauf ich achen soll?
Am besten, du verwendest einen Unicode-fähigen Editor und codierst deine Dokumente in UTF-8. Dann ist dein Quelltext leicht lesbar und du hast keine Probleme mit anderen Alphabeten.
Wichtig ist, dass dein Webserver die verwendete Zeichencodierung angibt. Siehe [Jendryschik] und [Ishida].
See ya up the road,
Gunnar
„Wer Gründe anhört, kommt in Gefahr nachzugeben.“ (Goethe)