Thomas J.S.: XML und "fremde Sprachen"

Beitrag lesen

Hallo!

Kann ich davon ausgehen, daß wenn ich alle "Nicht-Ascii-Zeichen" Zeichen als Unicode angebe, daß ich dann keine Fehlermeldungen bekomme.

Ja.

(auf die encoding Angabe im <?xml ...> würde ich an deiner Stelle nicht viel geben, denn auch der MS-Parser erkennt nicht alles richtig und machmal meldet einen Fehler deshalb)

Durch Probieren hab' ich herausgefunden, daß es windows-1250 bis 1259 gibt - Ich weiß jedoch nicht für welche Sprachen die sind.

Windows Codepage #    Display name  
1250                   Central European (Windows)
1251                   Cyrillic (Windows)
1252                   Western                        iso-8859-1
1253                   Greek (Windows)
1254                   Turkish (Windows)
1255 (logical)         Hebrew (ISO-logical)           iso-8859-8i
1255 (visual)          Hebrew (ISO-Visual)            iso-8859-8
1256                   Arabic (Windows)  
1257                   Baltic (Windows)  
1258                   Vietnamese

mehr zu char-set:
ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets und
ftp://ftp.isi.edu/in-notes/rfc1345.txt

Wenn ich Rusisch schließlich in HTML Seiten anzeigen möchte, so muß ich alle diese Zeichen nach Unicode konverdieren, oder?

Na ja... versuchte mal doch zuerst mit einer iso-Angabe, wenn das nicht klappt kannst du noch immer unicodes nehmen.

Was wenn diese nicht unicode sind. Kann man sie dann nur auf russichen Geräten lesen, oder nicht einmal da?

Wenn du eine iso-angabe machst und der parser es versteht, dann werden diese richtig dargestellt.
Hast du keine Angabe zu encoding (dann ist es automatsisch utf-8) wird der parser beim ersten nicht ascii Zichen abbrechen und nichts darstellen.

Kann man in HTML sagen, welchen Zeichensatz die Seite verwenden soll. (Ok, ok es gibt das diesen META-Tag - wird dieser schon unterstützt, oder gibt es Alternativen?)

Ja, in HTML ist das kein Problem.

Grüße
Thomas