Sven Rautenberg: UTF-8 Zeichen umwandeln

Beitrag lesen

Moin!

hab hier ein "kleines" Problem. Ich habe hier ein Datenbank-Dump vorliegen (kann nicht erneut erstellt werden, ich muss mit der jetzigen Datei arbeiten!) in welchem UTF-8-Zeichen im Klartext drin stehn.

Naja, irgendwie ist das alles andere als "Klartext".

Aber es scheint so, als ob jedes dieser Zeichen mit dem Präfix "u8" beginnt, und danach zwei Hexzahlen mit den in UTF-8 verwendeten Bytes folgen. Hab ich jetzt nicht explizit geprüft, wäre aber mein erster Ansatz dafür. Die üblichen deutschen Umlaute beginnen jedenfalls alle mit dem gleichen ersten UTF-8-Byte, und das ist in deinem Textauszug ebenfalls so. Ob dieses A-Tilde jetzt als 0xC3 codiert wird, hab' ich nicht im Kopf.

Beispiele:

[..] wie etwa in html u8c3bcblich [...]
[...] bleiben clevere sparer jederzeit flu8c3bcssig [...]
[...] die gesundheitlichen vorteile werden extra ausgehu8c3a4ngt wir wu8c3bcnschen allen viel spau8c39f beim probieren [...]

- Sven Rautenberg

--
"Love your nation - respect the others."