Beat: UTF-8

Beitrag lesen

"In der empfohlenen Kodierung UTF-8 wäre der Buchstabe ö (mit dem Unicode-Zeichenwert 246) als %C3%B6 dargestellt." ( http://de.wikipedia.org/wiki/URL_Encoding )
Der Übergang von 246 zu C3 B6 ist mir irgendwie unklar.

Unicode decimal 246 =
Unicode binär 00000000 11110110
Weil der Wert < 255 und das erste Bit des zweiten Byte eine 1 ist,
   werden für utf8 zwei Bytes verlangt mit der Maske
110..... 10.......
Nun werden die Bits von Unicode binär rechtsbündig in die Leerstellen gefüllt, und links mit 0en gepadded.
11000011 10110110
C   3    B   6

http://de.wikipedia.org/wiki/UTF-8

mfg Beat

--
><o(((°>           ><o(((°>
   <°)))o><                     ><o(((°>o
Der Valigator leibt diese Fische