pl: iso8859-1 -> utf-8

Beitrag lesen

hi,

auch wenn ich Deine Frage nicht so ganz verstehe...

Gibt es da eine Tabelle?

Unicode ist im Prinzip nur das Verwaltungssystem in dem jedes Zeichen der Welt einer eindeutigen Nummer -- dem sogenannten Codepoint -- zugeordnet ist, das ist die Zweckbestimmung des Unicode-Konsortium.

UTF-8 hingegen ist eine Kodierung die den Zusammenhang zwischen einem bestimten Codepoint und einer bestimmten Bytefolge beschreibt, praktisch ein Algorithmus.

Während in ISO-8859-1 der Codepoint 228 gleich Bytewertigkeit ist, ergeben sich in UTF-8-Kodierung aus demselben Codepoint 2 Bytes mit der Wertigkeit C3 A4. Umgekehrt definiert UTF-8 ebenso die Bestimmung des Codepoints aus einer bestimmten Bytesequenz.

Für PHP hab ich diesen Algorithmus hier mal aufgeschrieben.

mfg