Hi,
ich suche ein RegExp (kein schon vorhandenes Modul!) für folgendes Problem:
Ich benoetige eine Regular Expression mit dem ich einen
HTML-aehnlichen Argumentstring analysieren kann, der jedoch auch Quotes beherrscht.
Beispiele folgend.
Folgende Strings will ich bearbeiten:
<name1="wert1" name2="jx7jkakj js
">
(Dies ist noch kein Problem)
<irgendeinnamen = bla> (mit bla=[a-zA-Z0-9]*)
(Noch immer kein Problem)
<name="liste" value=("listitem1","listitem2","listitem3")>
(Nun wird es schon etwas knobeliger, was? Aber auch noch einfach lösbar.)
<name="wert1" value="dies ist ein "gequoteteter" Text">
(Und hier wird es schwer...)
<name="wert2" value2="dies ist ein "gequoteteter" <h1>H1</h1>-Text, mit HTML in sich.">
(Schach-Matt :))
Bei allem soll das Ergebnis ein Hash sein.
Obige Beispiel sollten dann folgenden Hash geben
%hash = (
name1 => "wert1",
name2 => "jx7jkakj js
",
irgendeinnamen => "bla",
liste => "(listitem1,listitem2,listitem3)",
name => "wert1",
value => "dies ist ein "gequoteteter" Text",
value2 => "dies ist ein "gequoteteter" <h1>H1</h1>-Text, mit HTML in sich."
)
Wer hat Ideen?
Ciao,
Wolfgang