MudGuard: C2A0 und split erledigt

Beitrag lesen

Hi,

ist es möglich, für /\s+/ eine Voreinstellung zu treffen, dass das auch für NonBreakingSpaces (C2A0) matcht? PS/Edit: split /[\s\xC2\xA0]+/, $str zum Heften ;)

Bist Du sicher, daß die Lösung auch zum Problem paßt?

Ich hätte eher /(?:\s|\xC2\xA0)+/ erwartet - Deine Konstruktion könnte auch das INVERTED EXCLAMATION MARK ¡ (Bytes C2 und A1) erwischen. Und alle anderen Bytefolgen, die C2 enthalten. Wenn's denn byteweise bearbeitet wird.

Oder, da es sich wohl um Unicode handeln soll, /[\s\xA0]+/u

cu,
Andreas a/k/a MudGuard