OK ab 5.8 kann man UTF8 konsequent behandeln. Leider muss ich in einem Fall immer noch mit Perl 5.6 Umgehen.
Thats bad :-(
Ich weiss, dass bei PHP die Versionenunterschiede auch beträchtlch sein können. Man muss das also schon konkreter definieren.
Aber die PHP Jungs sagten doch sinngemäß(ohne Hinweis auf alte Versionen): "Also wenn Du n UTF-8 String splitten willst, musst Du die MB Dinger nehmen". Das fand ich dann schon befremdlich.
PS: Etwas was definitiv auch in 5.8 nicht toll ist:
Warning: Wide Charakter in print...
Wann bekommst Du das? Ich hatte noch nicht einen Fall, wo mich dieses Warning _nicht_ auf eine Stelle aufmerksam gemacht hat, an der ICH Mist gebaut, bzw. etwas nicht beachtet habe.
UTF8 ist zwar das Perl interne Charakterencoding, aber Perl vergisst per default diese Eigenschaft nach aussen. Das ist verwirrend, und was verwirrt, ist nicht einfach.
Du würdest UTF8 brutal als Default überall erzwingen wollen? Das ist löblich, aber IMHO (noch) realitätsfern.
Wie verwirrend wäre das für all jene, die sich mit der Thematik überhaupt nicht auskennen?