Schon klar. Siehe:
http://de.wikipedia.org/wiki/UTF-8
aus Wikipedia, der freien Enzyklopädie
UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die verbreitetste Kodierung für Unicode-Zeichen; dabei wird jedem Unicode-Zeichen eine speziell kodierte Bytekette von variabler Länge zugeordnet. UTF-8 unterstützt bis zu 4 Byte, auf die sich wie bei allen UTF-Formaten alle 1.114.112 Unicode-Zeichen abbilden lassen.
Ich meine die Ausgangsdatei, die ich habe enthält uncodierte reine Unicodezeichen, bestehend aus jeweils 4 Hex-Zahlen.
Dass ich dies selber nachprogrammieren kann, weis ich auch. Ich dachte jetzt nur, dass perl oder auf CPAN irgendwo was zu finden wäre, dass genau dies Funktion schon enthält.
Ich habe leider nichts gefunden.
Dann wird mir wohl oder über nichts anders übrigbleiben als es selbst zu machen.