suit_: html tag erkennen

Beitrag lesen

»» Bitte zitiere vernünftig.

Erneut: zitiere bitte vernünftig.

es soll nichts ersetzt werden was zwischen < und > steht.

Vorher sagtest du noch folgendes:

»» »» Ich muss das Wort matchen welches nicht in einem html tag auftaucht.

Ein HTML-Tag ist aber mitnichten durch < und > begrenzt

Ich habs jetzt hinbekommen, in dem ich mit einer for Schleife und substr() mir einfach jedes Zeichen der Zeile ansehe. wenn ein < kommt ignoriere ich einfach alles bis wieder ein > kommt.

Der Ansatz ist aber defekt:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"  
       "http://www.w3.org/TR/html4/loose.dtd">  
<html>  
  <head>  
    <title>Example</title>  
  </head>  
  <body>  
    <p/foo/  
    <p>bar</p>  
  </body>  
</html>

Deine Routine würde beim Ersetzen von 'foo' durch 'baz' folgendes ausspucken:

[...]

  <body>  
    <p/foo/  
    <p>bar</p>  
  </body>

[...]

Das Ergebnis sollte aber so aussehen:
[...]

  <body>  
    <p/baz/  
    <p>bar</p>  
  </body>

[...]