Beat: Character Set TroubleShooting

Beitrag lesen

Korrekt. Nirgendwo im Artikel steht das Wort "Zeichensatz".
Doch, in der Überschrift. „Character set“ heißt auf Deutsch „Zeichensatz“.
Ich selbst übersetze das Kunstwort "charset" als "Character Settings".
?? Zeicheneinstellungen? Das ist wohl kaum sinnvoll.
Wann immer von "charset" die Rede ist, ist „character encoding“, also „Zeichencodierung“ gemeint.

Nein. da ist ein _en-_ zuviel.

Ein Charset ist eine Tabelle von Unicode-zu-Bytes Festlegungen.
Charset ist der Feldbezeichner, der du einen Charset-Wert zuweist, meint also den Namen einer solchen Tabelle.
Code ist ein abstrakter Punkt wie in Unicode in dieser Tabelle.
Encode und Decode sind Funktionen der Transformation zwischen zwei Tabellen.
Zwei Charsets sind beteiligt. Selten muss man beide Charsets angeben, da meist ein internes Charset beteiligt ist (bei Perl zum Beispiel ein UTF-8 Derivat, bei www-urlencode ein Algorithmus der zudem Characters ausserhalb ASCII als ASCII transportiert, unter anderem). Manchmal muss man gar kein charset angeben, weil er aus einem anderen Wert angewendet wird.
Bei url_encode wird nämlich das Programm-interne Charset als Input verwendet. Die Transformation vom Content-Charset des Dokuments zum Programm-internen Charset ist da bereits Geschichte.

mfg Beat

--
><o(((°>           ><o(((°>
   <°)))o><                     ><o(((°>o
Der Valigator leibt diese Fische