mal eine Frage. Was genau ist der Unterschied zwischen utf-8 und unicode?
Kanonisch heisst der charset UTF-8.
Unicode ist ein Numerierungsschema für Glyphen, bzw. deren semantische Beschreibung, welche vom Unicode Consortium betrieben wird.
UTF-8 ist ein ein Wert zum Feld Zeichensatz (eng. charset).
Ein Zeichensatz ist eine Tabelle, welche Bytes zu Unicodes mappt und wird also für Encoding und Decoding verwendet, welches der Vorgang ist Bytes so umzubauen, dass die Bedeutung nach Unicode erhalten bleibt.
Was bedeutet es, wenn eine Sprache, zb. Java, Unicode unterstützt? Was für eine, die es nicht unterstützt?
Es besagt, dass alle Charsets, welche eine Sprache oder eine Programm bei Encoding/Decoding berücksichtigt, auch den Unicode Standard mappen.
Da Unicode ein sich entwickelndes Sytsem ist, wäre eine richtige Aussage:
Programm X unterstützt Unicode Standard XY (den In Version XY beschriebenen Unicode Umfang).
Wichtiger ist in der Paxis, ob Programme oder Sprachen mut Multibyte Charsets umgehen können, wie zum Beispiel UTF-8.
mfg Beat
><o(((°> ><o(((°>
<°)))o>< ><o(((°>o
Der Valigator leibt diese Fische