Sven Rautenberg: braucht 64-Bit doppelt soviel Speicher wie 32-Bit?

Beitrag lesen

Moin!

Hello,

Nee, den "Buchstaben" gibts dann ja auch bald nicht mehr, sondern nur noch den Codepoint in der UNI-Code-Tabelle. Und der benötigt dann 1 bis 4mal soviel Speicherplatz und, was viel schlimmer ist, bis zu 100mal soviel Rechenzeit (Ticks) um erkannt zu werden.

Auch bei ASCII ist ein "Buchstabe" nichts anderes als ein Codepoint. Was meinst Du mit "erkennen"? Den passenden Glyphen in einer Schriftart finden?

Bei ASCII (oder anderen In-Byte-Codes) wird die Codetabelle vorher geladen und dann kann die Darstellung des Zeichens einfach per Dereferenzierung adressiert werden.

Mit den bekannten Problemen.

Abgesehen davon ist das Ausgeben eines Zeichens durchaus nicht unaufwendig. Und Unicode ermöglicht es erst, dies für alle menschlichen Sprachen auch korrekt zu tun - die Rechenpower ist locker vorhanden.

Bei UTF muss leider der gesamte Text gestreamt werden, bevor die Zeichnauflösung stattfinden kann. Da ist also nix mehr mit Wahlfreiem Zugriff. Je länger nun so eine Textsequenz ist, desto mehr Ticks verschluckt sie, bevor sie in "Zeichen" zerlegt worden ist.

Falsch. Du kannst anhand jedes einzelnen Bytes erkennen, welche der bis zu vier vorausliegenden oder nachfolgenden Bytes dich auch interessieren sollten - ein Zugriff auf den Gesamttext ist nicht erforderlich.

- Sven Rautenberg