Marko: Regular expression Schwierigkeit

Beitrag lesen

Hi,

Ich kenne mich leider nur mit reguläre Ausdrücke in Javascript aus. In Javascript ist es so, daß immer der längste Ausdruck gefunden wird, daher wird das letzte ">" auch nicht als "." angesehen.

Wie kommst DU auf JavaScript? Ich arbeite in .NET ;)

Okay, an verschachtelte Tags hab' ich nicht gedacht, da muß ich noch drüber nachdenken.

Wenn Dir was einfällt, melde dich. Ich habs vorerst stur mit nem Riesenalgo gelöst, der Zeichen für Zeichen durckramt, mit Buffern und so :/

Was willst Du eigentlich tun, wenn ich fragen darf?

Einen HTML-Parser, ist schon fertig. Hast Du gewusst, dass die meisten Seiten (google.de, web.de, freemail.de, ...) die Tags nicht richtig Verschachtelt haben? Da stösst man auf sachen wie <tr></td height="20"> ...

Gruss, Marko