Gunnar Bittersmann: umstellung mariadb, nun codierungsproblem

Beitrag lesen

@@Rolf B

Solange Du in Perl nicht versuchst, einen solchen String zeichenweise (statt byteweise) zu verarbeiten, fällt das gar nicht auf.

Bist du da mit der Verneinung und Zeichen und Bytes durcheinander gekommen?

Ja. Hm. Scheißencodings. Ich hatte den Text mehrfach umgeändert. Gemeint hatte ich: Wenn man die Bytefolge eines latin1-codierten Strings als UTF-8 deutet und dann zeichenweise verarbeitet, geht's schief. Weil nur einzelne Bytes mit Wert > 127 da sind, und keine UTF-8 Sequenzen.

Oje. Jetzt hab ich am Ende vermutlich mehr Durcheinander gemacht statt sortiert.

Ähm, ja. Hätte es nicht das getan:

Solange Du in Perl nicht versuchst, einen solchen String byteweise (statt zeichenweise) zu verarbeiten, fällt das gar nicht auf.

Ich weiß, dass man sich 100%ig auf UTF-8 einlassen sollte.

Weiß ich ja auch. Aber wenn man eine Tonne Latin1-Legacy hat

Dann hat man schon vor Jahren was falsch gemacht.

mag das anders aussehen.

Aber ja, manchmal mag es einfacher (das kann dann auch bedeuten: sinnvoller) sein, die Zeichencodierung abweichend von UTF-8 anzugeben anstatt den ganzen Datenbestand umzucodieren.

🖖 Живіть довго і процвітайте

--
Ad astra per aspera