Direktes Ausgeben von String von Der Martin, 14.01.2008 18:03

Direktes Ausgeben von String

Der Martin 14.01.2008 18:03

Hallo,

eine Funktion namens ord()
Über eben jene bin ich gestpolpert, habe aber die Vorahnung, dass z.B. UFT8-2-Byte-Zeichen als zwei Zeichen interpretiert werden und mir die Dezimalwerte beider Zeichen einzeln ausgegeben werden.

selbstverständlich - genau das wolltest du doch auch:
"dass ich genau in dem String sehen kann, was drin steht, egal welche Codierung"
Diesen Halbsatz in deinem ersten Posting verstehe ich genau so, nämlich dass du den String Byte für Byte durchgehen willst, ohne Rücksicht auf irgendeine Codierung.

Am liebsten wäre mir die ⚏ oder ⚏ -Variante. Ist das evtl. möglich?

Das heißt, dass du eben doch eine Codierung anwenden bzw. voraussetzen willst, nämlich UTF-8. Ist aber relativ einfach: Sobald das MSB eines Bytes gesetzt ist, stellt es selbst kein vollständiges Zeichen dar, sondern ist Teil einer aus mehreren Bytes bestehenden Gruppe (siehe Beschreibung der Codierung). Auf diese Weise bekommst du für jedes Zeichen im String eine Gruppe von 1..4 Byte, aus denen du mit ein wenig Bitmaskierung und Bitschieberei den Unicode-Wert ermitteln kannst.

So long,
Martin

--
Butterkeksverteiler zu werden ist vermutlich eine der wenigen beruflichen Perspektiven, die sich noch bieten, wenn man einen an der Waffel hat.
(wahsaga)

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Der Martin: Direktes Ausgeben von String

Beitrag lesen

Direktes Ausgeben von String

Direktes Ausgeben von String