Cybaer: UTF-8 ISO MIX Wie erkennen und anpassen

Beitrag lesen

Hi,

Nun habe ich die Funktion valid_utf8() probiert, da bekomme ich dann tatsächlich 2 = false, 1= utf-8 "3". Wobei ich nicht ganz verstehe was mit den leveln 1-4 gemeint ist.

Ein gültiges UTF-8-Zeichen kann aus 1 bis 4 Bytes bestehen. Wenn Du "3" als Ergebnis bekommst, ist mindestens ein Zeichen im Text, das aus 3 Bytes besteht, aber keines, das aus 4 Bytes besteht. Das ist soweit erstmal nicht wichtig. Besondere Beachtung kann man aber immer dem Ergebnis "1" schenken. Das bedeutet, daß der Text nicht nur gültiges UTF-8 ist, sondern auch gültiges ASCII (der Text ist also *u.a. auch* UTF-8, aber eben nicht nur).

Gruß, Cybaer

--
Man muß viel gelernt haben, um über das, was man nicht weiß, fragen zu können.
(Jean-Jacques Rousseau, Philosoph u. Schriftsteller)