Tach!
Es sind 6 sichtbare und das Zeichen U+DFC2 aus dem Low-Surrogates-Bereich zwischen 𝟂 und €.
In UTF-8 gibt es keine Surrogate. Und der Codepoint U+DFC2 ist falsch bzw, zuviel im Ergebnis. Diese 6 Codepoints müssen rauskommen: 41 42 43 1D7C2 20AC E4
Genauer gesagt, in UTF-8 werden sie nicht benötigt. Nichtsdestotrotz kann man diese Codepoints in UTF-8 kodieren. Und in deinen Daten ist eben die UTF-8-Sequenz für den genannten Codepoint drin.
Aber zu "In UTF-8 gibt es keine Surrogate" passt "(Kodierung ist UTF-8)" nicht. Du müsstest mal deine UTF-8-Sequenz korrekt erstellen oder die Logik in deinen Aussagen überprüfen.
Ich ziehe diese Aussagen zurück, hab nicht genau genug hingeschaut.
dedlfix.