Hallo,
ich habe eine riesen XML mit über 500 MB. Ich möchte aus dem Datensatz Inhalte entfernen. Soweit kein Problem mit Suchen/Ersetzten.
Nur haben wir auch Datensätzte bei denen
<h2>irgendetwas</h2>
gelöscht werden sollen. Das H2 kann man einfach mit Suchen/Ersetzen löschen. Aber den Zwischenraum muss man dann manuell löschen. Bei der Menge an Daten eine Wochenaufgabe. Daher habe ich gesucht und RegX http://docs.notepad-plus-plus.org/index.php/Regular_Expressions gefunden.
Zwischen den <h2> kann alles sein auch Sonderzeichen öäüß groß und kleinschreibung sowie mehr html usw. Ich bin aufgeschmissen, vielleicht kann mir hier jemand unkompliziert helfen
Eure Sonja.