MichaelB: HTML-Dateien umwandeln

Hallo Leute,

gibt es eine gute Möglichkeit HTML-Dateien "umzuwandeln" nach bestimmten Regeln (bestimmte Tags/Attribute durch andere ersetzen oder manipulieren oder  hinzufügen).
AWK bietet ja gute Möglichkeiten zur Manipulation von Texte. Für HTML wäre es aber  praktischer, wenn man die Manipulation auf DOM-Ebene vornehmen könnte. Ein AWK für DOM wäre ja mein Traum. Wer weiss. Vielleicht gibt es ja sowas (vielleicht sogar via XSLT [was ja eigentlich zumindest für XHTML funktionieren müsste?] oder ähnlichem?). Ansonsten muss man halt eine "richtige" Programmiersprache wie Perl/Python/Java/... bemühen.

Vielleicht hat ja jemand eine gute Idee

Gruss
   MichaelB

  1. Hallo,

    Vielleicht gibt es ja sowas (vielleicht sogar via XSLT [was ja eigentlich zumindest für XHTML funktionieren müsste?] oder ähnlichem?).

    Klar kannst Du aus einer XML-Struktur eine andere Ausgabe erreichen: nach HTML, XML (z. B. XHTML oder SVG) oder einfach nur Text.

    Ob das Sinn macht, haengt vor allem davon ab, ob die Datenbasis strukturiert genug ist, um eine ebensolche Vorlage schreiben zu koennen. Im Zweifelsfalle kommt man vielleicht mit cleverem Suchen-und-Ersetzen einfacher ans Ziel.

    MfG, Thomas

    1. Hallo,

      Vielleicht gibt es ja sowas (vielleicht sogar via XSLT [was ja
      eigentlich zumindest für XHTML funktionieren müsste?] oder
      ähnlichem?).

      Klar kannst Du aus einer XML-Struktur eine andere Ausgabe
      erreichen: nach HTML, XML (z. B. XHTML oder SVG) oder einfach
      nur Text.

      Mir gehts primär um HTML -> (mainpuliertes)HTML.
      Wobei man mit TIDY aus HTML ja relativ problemlos XHTML machen. Und damit könnte man ja dann tatsächlich XSLT anwenden.

      Ob das Sinn macht, haengt vor allem davon ab, ob die Datenbasis
      strukturiert genug ist, um eine ebensolche Vorlage schreiben zu
      koennen. Im Zweifelsfalle kommt man vielleicht mit cleverem
      Suchen-und-Ersetzen einfacher ans Ziel.

      Ja .... hab ich schon probiert. Reguläre Ausdrücke lassen ja sehr viel zu. Wird aber alles in allem zu kompliziert. Deshalb ist ja meine Hoffnung das es mit Manipulation einer DOM-Struktur etwas eleganter geht. Das kommt ja HTML zumindest etwas näher.

      Gruss
         MichaelB

  2. Hi,

    Ansonsten muss man halt eine "richtige" Programmiersprache
    wie Perl/Python/Java/... bemühen.

    ... wobei diese den Vorteil haben könnte, daß tausende anderer Anwender Dein Problem auch schon hatten und es in Form gut dokumentierter Open-Source-Module kostenlos im Web zur Verfügung gestellt haben.

    Ein Besuch im CPAN lohnt sich da allemal.

    Viele Grüße
          Michael