huntter: Suche Programm zum HTML parsen/formatieren

Hallo,

gibt es ein Programm (am besten Freeware), mit dem ich mithilfe von ein bisschen Code einfach Inhalte von bestimmten HTML-Tags aus Seiten beliebig formatiert zusammentragen kann?

zB. sowas:

<div class="blogentry">Hier Text, <br>bla bla bla.</div><p>irgendwas</p><div class="blogentry">Text <br><br>blabla</div><div id="add">foo</div><div class="blogentry">Noch ein Text</div>

zu sowas:

<x>Hier Text, bla bla bla.</x>  
<x>Text blabla</x>  
<x>Noch ein Text</x>

Thx!

  1. gibt es ein Programm (am besten Freeware)

    Ist mir pers. keins bekannt, aber

    zB. sowas:

    <div class="blogentry">Hier Text, <br>bla bla bla.</div><p>irgendwas</p><div class="blogentry">Text <br><br>blabla</div><div id="add">foo</div><div class="blogentry">Noch ein Text</div>

    zu sowas:

    <x>Hier Text, bla bla bla.</x>

    <x>Text blabla</x>
    <x>Noch ein Text</x>

      
    kann man mit einigen RegEx-Kenntnissen und $ProgrammierspracheDeinerWahl in relativ kurzer Zeit bewerkstelligen.  
      
    Schrat
    
    1. kann man mit einigen RegEx-Kenntnissen und $ProgrammierspracheDeinerWahl in relativ kurzer Zeit bewerkstelligen.

      Diese herangehensweise ist wie immer sehr schlau.

      1. kann man mit einigen RegEx-Kenntnissen und $ProgrammierspracheDeinerWahl in relativ kurzer Zeit bewerkstelligen.
        Diese herangehensweise ist wie immer sehr schlau

        Dann entferne den Hinweis auf RegEx, lasse aber $Programmiersprache stehen.

        Schrat - dessen einzige Krankheit im Anzug die wohltuende Müdigkeit ist. Tse Tse sei gelobt

  2. Wenn du wohlgeformten Code hast, hilft dir womöglich XSLT weiter, ein beliebiger XML-Parser tuts auch.

    Ansonsten gibts noch diesen Kandidaten, der teilweise auch mit hochgradiv invalidem Code zurecht kommt.

  3. Hi huntter,

    wenn du Perl Kenntnisse hast, lohnt sich wie immer ein Blick ins CAPN. Du könntest z.B. dieses Modul für deine Aufgabe verwenden.

    MfG
    Otto