xwolf: RegExp gesucht...

Beitrag lesen

Hi,

ich suche ein RegExp (kein schon vorhandenes Modul!) für folgendes Problem:

Ich benoetige eine Regular Expression mit dem ich einen
HTML-aehnlichen Argumentstring analysieren kann, der jedoch auch Quotes beherrscht.
Beispiele folgend.

Folgende Strings will ich bearbeiten:
    <name1="wert1" name2="jx7jkakj js
                      ">

(Dies ist noch kein Problem)

<irgendeinnamen = bla>    (mit bla=[a-zA-Z0-9]*)

(Noch immer kein Problem)

<name="liste" value=("listitem1","listitem2","listitem3")>

(Nun  wird es schon etwas knobeliger, was? Aber auch noch einfach lösbar.)

<name="wert1" value="dies ist ein "gequoteteter" Text">

(Und hier wird es schwer...)

<name="wert2" value2="dies ist ein "gequoteteter" <h1>H1</h1>-Text, mit HTML in sich.">

(Schach-Matt :))

Bei allem soll das Ergebnis ein Hash sein.
Obige Beispiel sollten dann folgenden Hash geben
%hash = (
   name1 => "wert1",
   name2 => "jx7jkakj js
                      ",
   irgendeinnamen => "bla",
   liste => "(listitem1,listitem2,listitem3)",
   name => "wert1",
   value => "dies ist ein "gequoteteter" Text",
   value2 => "dies ist ein "gequoteteter" <h1>H1</h1>-Text, mit HTML in sich."
)

Wer hat Ideen?

Ciao,
 Wolfgang