Christian Kruse: UTF8 oder ISO-8859-1, das ist hier die frag....

Beitrag lesen

Hallo bauchidgw,

ich hab ne frage auf die ich mir aufgrund
fehlender einarbeitung in das thema nicht
wirklich helfen kann.

Dem kann abgeholfen werden.

wie erkenn ich ob der string jetzt in utf8 oder
iso kodiert ist?

So ohne weiteres gar nicht. Du kannst dich mit
dem Wuerg-Around behelfen, den Z.N.S. gepostet
hat, aber prinzipiell ist das nicht moeglich. Das
ist leider eine der Schwaechen von HTTP. Was du
allerdings tun kannst, ist folgendes: du sendest
einen sinnvollen Content-Type header
(Content-Type: text/html; charset=charset) und
setzt per accept-encoding fest, welche Charsets
du akzeptierst:

<form method="GET" accept-charset="ISO-8859-15,UTF-8">

Per Definition darf dir dann nichts anderes
geschickt werden als ISO-8859-15 oder UTF-8.
Danach fuehrst du ein Formular-Feld ein,
meinetwegen 'cs', das nur ein Entity enthaelt:

<input type="hidden" name="cs" value="&#255;">

Dieses Entity ist in ISO-8859-1 bzw. ISO-8859-15
kodiert "\377". In UTF-8 kodiert ist es
"\303\277". So kannst du also pruefen, in welchem
Charset die Sachen geschickt wurden.

Gruesse,
 CK

--
http://cforum.teamone.de/
http://wishlist.tetekum.de/
If God had meant for us to be in the Army, we would have been born with green, baggy skin.