Hallo!
Kann ich davon ausgehen, daß wenn ich alle "Nicht-Ascii-Zeichen" Zeichen als Unicode angebe, daß ich dann keine Fehlermeldungen bekomme.
Ja.
(auf die encoding Angabe im <?xml ...> würde ich an deiner Stelle nicht viel geben, denn auch der MS-Parser erkennt nicht alles richtig und machmal meldet einen Fehler deshalb)
Durch Probieren hab' ich herausgefunden, daß es windows-1250 bis 1259 gibt - Ich weiß jedoch nicht für welche Sprachen die sind.
Windows Codepage # Display name
1250 Central European (Windows)
1251 Cyrillic (Windows)
1252 Western iso-8859-1
1253 Greek (Windows)
1254 Turkish (Windows)
1255 (logical) Hebrew (ISO-logical) iso-8859-8i
1255 (visual) Hebrew (ISO-Visual) iso-8859-8
1256 Arabic (Windows)
1257 Baltic (Windows)
1258 Vietnamese
mehr zu char-set:
ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets und
ftp://ftp.isi.edu/in-notes/rfc1345.txt
Wenn ich Rusisch schließlich in HTML Seiten anzeigen möchte, so muß ich alle diese Zeichen nach Unicode konverdieren, oder?
Na ja... versuchte mal doch zuerst mit einer iso-Angabe, wenn das nicht klappt kannst du noch immer unicodes nehmen.
Was wenn diese nicht unicode sind. Kann man sie dann nur auf russichen Geräten lesen, oder nicht einmal da?
Wenn du eine iso-angabe machst und der parser es versteht, dann werden diese richtig dargestellt.
Hast du keine Angabe zu encoding (dann ist es automatsisch utf-8) wird der parser beim ersten nicht ascii Zichen abbrechen und nichts darstellen.
Kann man in HTML sagen, welchen Zeichensatz die Seite verwenden soll. (Ok, ok es gibt das diesen META-Tag - wird dieser schon unterstützt, oder gibt es Alternativen?)
Ja, in HTML ist das kein Problem.
Grüße
Thomas