Hi,
Bleibt das Problem, warum mein Client diverse der Lettern als Fragezeichen anzeigt. Gibt es günstigere Entitäten, etwa im Bereich &8xxx;?
nope, die meisten Entities bestehen einfach aus & + # + Unicodenummer + ;. Ein paar werden anders codiert, hauptsaechlich aus dem ISO-8859-1-Bereich.
hm, schade - manche glaube ich als doppelt zu kennen.
Abhilfe schafft evtl. das explizite Umschalten auf UTF-8 beim Client (bei mir gehts jedenfalls).
Stimmt, danke für den Tip!
ich schlage nochmals eine einheitliche Unicodecodierung vor, damit waerst du aus dem Schneider ;) Gerade bei einem solchen Internationalitaetsgrad...
Ja, sicher. Für lokal orientierte Fälle ist das aber möglicherweise overdone. Nun, ich überleg mir da was... z.B. eine Methode as_unicode(), eine raw()... ;-)
Cheatah, bisher allerdings nur für die Zukunft planend