Hi
Kriege ich solche Seiten nun mit irgendeiner XML-Syntax wieder "zurückverwandelt" in ganz einfaches HTML ?
Ich wüsste keine Lösung mit was XML mäßigem, aber sowas dürfte mit Perl/PhP/beliebe regex fähige Sprache doch recht gut machbar sein. Allerdings ist das mit dem überflüssigen Tags entfernen (so gut wie) unmöglich. Ich hab mal kurz folgendes auprobiert, funktioniert auch ganz gut:
##wäre jetzt wie erkennbar in Perl####
$text = 'irgendein irgenwie eingelesener Text';
$text =~ s/(\r)?\n>/>\n/g;#alle > in einer neuen Zeile nach oben schieben
$qwer = 0;
while ($qwer < 30)#hab keine Ahnung warum das noetig ist, ich bin auch zu muede um "wirklich" nachzudenken, auf jedenfall werden Tags in mehreren Linien sonst nur zum Teil (Die erste neue Linie) wieder in ein Linie gebracht
{
$text =~ s/(<[^>]*)\r?\n/$1 /g; #Tags in mehreren Linien in eine Linie bringen
$qwer++;
}
$text =~ s/></>\n\r</g;#hintereinnanderfolgende Tags in mehrere Zelien bringen
$text =~ s/(<.*>)/lc($1)/eg;# Tags kleinschreiben
print $text;#beliebeige Ausgabeform
Das ist jetzt nur sehr schnell mal getippt, und nicht sonderlich verständlich, aber funktioniert ganz gut. Allerdings wird im Moment der ganze Inhalt von Tags kleingeschrieben, was unpraktisch sein kann. Ausserdem müsste man dem Script noch beibringen dass es alle Dateien eines Verzeichnisses so korigiert werden, was aber IMHO nicht schwer ist.
Die beste Lösung wäre allerdings natürlich ein neues XSLT Script/Programm/wasauchimmer, wie heißt das jetzt korrekt? Ich denke allerdings das sowas nicht gerade vorhast ;-).
mfg Andres Freund