Tach!
welche HTML-relevanten Zeichen (Codes) gehen nicht problemlos in utf-8 über?
Keine. UTF-8 kann alle Unicode-Zeichen codieren.
Schade, dass Du mich nicht verstehen willst! :-(
Dann solltest du mal beschreiben, was mit übergehen konkret gemeint ist.
Welche Bytes, die iso8859-1 repräsentieren und für HTML (ohne DATA!) benutzt werden, gehen nicht problemlos in eine Multibyte-Codierung (hier: utf-8) über, wenn man denselben Bytestream benutzt?
Beschreib doch mal deine Aufgabenstellung genauer. Auch hier wieder kann ich aus dem unspezifischen "übergehen" nicht erkennen, was da wie ablaufen soll.
Anders herum gefragt:
Was wird aus den Bytewerten, die keine direkte Repräsentanz finden in UTF-8?
Ungültiges UTF-8 wird zum Fragezeichen im auf der Spitze stehenden Viereck. Welcher Vorgang bei dir unterlässt es denn ungültiges UTF-8 zu erzeugen?
Gibt es da eine Tabelle?
Gibt es überhaupt Werte aus iso-8859-1 über #127, die in utf-8 wieder eine gleichartige Darstellung bekommen?
Versteh ich auch nicht, was du genau meinst. Wenn ISO-8859-1 vorliegt (mit Zeichen/Bytes über 127) muss das umkodiert werden, wenn man das als UTF-8 haben möchte.
dedlfix.