Und gleich verbockt, sorry, so soll's sein:
^([\x00-\x7f]|[\xc0-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xf7][\x80-\xbf]{3}|[\xf8-\xfb][\x80-\xbf]{4}|[\xfc-\xfd][\x80-\xbf]{5})*$
Die Werte sind unter http://www.cl.cam.ac.uk/~mgk25/unicode.html#utf-8 aufgelistet.