Hallo Christian,
Als jemand, der sich ausgesprochen gut mit Regexen auskennt (sogar soweit, dass ich mal eine Engine dafür implementiert habe, um mein Verständnis zu verbessern) lass dir sagen: parse niemals XML (oder HTML) mit Regexen. Du wirst dir früher oder später eine blutige Nase holen. Das ist die Quintessenz aus allen meinen Erfahrungen damit. Ich verstehe, dass es dir sauer aufstösst, wenn dir jemand sagt „die Lösung war kacke,“ aber ich will dir nichts böses damit, im Gegenteil: ich erspare dir Stunden von Schmerzen.
hat sich in den letzten Jahren soviel verändert, dass der Gebrauch von Regex in so einem Fall schon einer Todsünde gleich kommt? Offensichtlich. Ich kann mich noch gut an die Zeit erinnern, als PHP noch keine brauchbaren XML-Parser mitbrachte und überall im Netz allerlei Scripte auf rege Nachfrage stießen, die das Problem ebenso mit Stringfunktionen und/oder Regex angingen. War ja auch eigentlich kein großes Ding, denn letztendlich bleibts ja doch nur ne simple Textdatei mit einer Struktur die es zu erkennen gilt. Daher tue ich mich verständlicherweise schwer das Ganze als so problematisch anzusehen, wenn das was vorher gut war auf einmal extrem schlecht sein soll. Aber gut, auch wenn ich es jetzt nicht ganz nachvollziehen kann, so vertraue ich doch mal auf die Crowdkompetenz hier. Aber nur um das nochmal klarzustellen, ich habe nie gesagt hier sollte man mit Regex dran gehen, sondern nur es wäre eine Option von vielen, und vor allem wenn es gar nicht um XML geht und damit komme ich direkt zum nächsten Punkt...
Wenn es kein XML ist, verwendet man ein anderes Tool um die Daten zu parsen. Das Argument ist doch nicht „verwende immer XML-Parser,“ das hat Gunnar nicht gesagt und Dedlfix und ich auch nicht. Das Argument ist „verwende das richtige Tool für den richtigen Job.“
Was wäre das dann für ein Tool, wenn zb. die vorliegende Datei jetzt nur eine simple Textdatei wäre oder ein Sammelsurium aus zusammenkopierten Inhalten in einer inkonformen HtmlDatei?
Gruss
Henry