dedlfix: iso8859-1 -> utf-8

Beitrag lesen

Tach!

welche HTML-relevanten Zeichen (Codes) gehen nicht problemlos in utf-8 über?

Keine. UTF-8 kann alle Unicode-Zeichen codieren.

Schade, dass Du mich nicht verstehen willst! :-(

Dann solltest du mal beschreiben, was mit übergehen konkret gemeint ist.

Welche Bytes, die iso8859-1 repräsentieren und für HTML (ohne DATA!) benutzt werden, gehen nicht problemlos in eine Multibyte-Codierung (hier: utf-8) über, wenn man denselben Bytestream benutzt?

Beschreib doch mal deine Aufgabenstellung genauer. Auch hier wieder kann ich aus dem unspezifischen "übergehen" nicht erkennen, was da wie ablaufen soll.

Anders herum gefragt:
Was wird aus den Bytewerten, die keine direkte Repräsentanz finden in UTF-8?

Ungültiges UTF-8 wird zum Fragezeichen im auf der Spitze stehenden Viereck. Welcher Vorgang bei dir unterlässt es denn ungültiges UTF-8 zu erzeugen?

Gibt es da eine Tabelle?

Gibt es überhaupt Werte aus iso-8859-1 über #127, die in utf-8 wieder eine gleichartige Darstellung bekommen?

Versteh ich auch nicht, was du genau meinst. Wenn ISO-8859-1 vorliegt (mit Zeichen/Bytes über 127) muss das umkodiert werden, wenn man das als UTF-8 haben möchte.

dedlfix.