TS: iso8859-1 -> utf-8

Beitrag lesen

Hallo und guten Tag,

Wenn ich heterogenen Input in verschiedenen Kodierungen zentral speichern möchte, scheint mir das weniger unsinnig, sondern eher eine verdammt gute Idee zu sein. Womöglich das Original zusätzlich(!) noch speichern, um bei etwaigen Kandidaten, bei denen sich "falsch geraten" herausstellt, nochmal nachbessern zu können.

Das halte ich für eine gute Anregung!

Ohne manuelle Nacharbeit wird es vermutlich nie gehen. Es stehen ja auch immer wieder HTML-Entities drin, die dann bei der konsequenten Weiterverarbeitung auch wieder doppelt für den HTML-Kontext kodiert werden, also dann deren Kodierung sichtbar gemacht wird (dargestellt wird).

Grüße
TS

--
es wachse der Freifunk
http://freifunk-oberharz.de