Hallo,
eine Funktion namens ord()
Über eben jene bin ich gestpolpert, habe aber die Vorahnung, dass z.B. UFT8-2-Byte-Zeichen als zwei Zeichen interpretiert werden und mir die Dezimalwerte beider Zeichen einzeln ausgegeben werden.
selbstverständlich - genau das wolltest du doch auch:
"dass ich genau in dem String sehen kann, was drin steht, egal welche Codierung"
Diesen Halbsatz in deinem ersten Posting verstehe ich genau so, nämlich dass du den String Byte für Byte durchgehen willst, ohne Rücksicht auf irgendeine Codierung.
Am liebsten wäre mir die ⚏ oder ⚏ -Variante. Ist das evtl. möglich?
Das heißt, dass du eben doch eine Codierung anwenden bzw. voraussetzen willst, nämlich UTF-8. Ist aber relativ einfach: Sobald das MSB eines Bytes gesetzt ist, stellt es selbst kein vollständiges Zeichen dar, sondern ist Teil einer aus mehreren Bytes bestehenden Gruppe (siehe Beschreibung der Codierung). Auf diese Weise bekommst du für jedes Zeichen im String eine Gruppe von 1..4 Byte, aus denen du mit ein wenig Bitmaskierung und Bitschieberei den Unicode-Wert ermitteln kannst.
So long,
Martin
Butterkeksverteiler zu werden ist vermutlich eine der wenigen beruflichen Perspektiven, die sich noch bieten, wenn man einen an der Waffel hat.
(wahsaga)