RW: HTML code entfernen

Hallo!!!! WER KANN HELFEN

Suche Quelltext (Filter) um alle bekannten html Code (Befehle) per PHP aus einer Datei zu entfernen.
strip_tags reicht nicht aus !

Möchte den Textinhalt rausfiltern zum bearbeiten

Danke schon im vorraus

RW

  1. Suche Quelltext (Filter) um alle bekannten html Code (Befehle) per PHP aus einer Datei zu entfernen.
    strip_tags reicht nicht aus !

    Möchte den Textinhalt rausfiltern zum bearbeiten

    keine ahnung was du willst

    1. Suche Quelltext (Filter) um alle bekannten html Code (Befehle) per PHP aus einer Datei zu entfernen.
      strip_tags reicht nicht aus !

      Möchte den Textinhalt rausfiltern zum bearbeiten

      keine ahnung was du willst

      Richtung >>>>> Suchmaschinen

      Die ersten Seiten für ein Suchbegriff GOOGLE
      Filter mir die Metas raus >
      Filter mir den Text raus >
      gleiche das ganze ab >>>> Richtung Suchm.
      kann meine Seite gestalten bzw. verbessern

      RW

      1. Hallo RW,

        keine ahnung was du willst

        Richtung >>>>> Suchmaschinen

        Die ersten Seiten für ein Suchbegriff GOOGLE
        Filter mir die Metas raus >
        Filter mir den Text raus >
        gleiche das ganze ab >>>> Richtung Suchm.
        kann meine Seite gestalten bzw. verbessern

        sag mal, ist Deutsch nicht Deine Muttersprache? Falls doch, waeren ganze Saetze dem Verstaendnis Deines Problems sehr foerderlich. Ich habe das obige drei Mal durchlesen muessen, um zu verstehen, was Du willst.

        Zum Problem:
        Deine JS-Sachen (oder ist das VB-Skript?) bleiben uebrig. Blind ins Blaue hinein wuerde ich mal raten, dass innerhalb des JS-Teils irgendwo Vergleiche mit ">" oder "<" vorkommen => da endet dann die Suche mit Deinem Vergleich.

        Loesungsvorschlag:
        Geh zwei Mal ueber die Datei drueber und schneide beim ersten Mal nur die Kommentare raus (Du kommentierst doch Deinen Code aus, oder?) und erst beim zweiten Mal die Tags.

        Gruss
        Thomas

        1. @ Thomas

          Ist Ok, ich bin zu schnell dabei gewesen.
          Man sollte erst lesen und dann schreiben bzw. versenden.

          Ich möchte eine Lösung finden um etwa 10 URL auszuwerten.
          1. nach Meta Tags
          2. nach Inhalt (Text)--- Problem ---

          Daraus möchte ich die wichtigsten Wörter mir anzeigen lassen
          (Menge usw.)um dann meine Seite zu erstellen.

          1. Ich möchte eine Lösung finden um etwa 10 URL auszuwerten.

            URL? Resourcen im Web?
            Und das ganze mit PHP?

            Evtl. ist Snoopy was für Dich - such mal bei sourgeforce, das ist dort als Projekt geführt. Im README gibt es Anweisungen, wie man den Text einer Seiten fetcht. Das die Klasse bei sourceforge etwas älter ist, tut der Qualität übrigens keinen Abbruch...

  2. Hallo,

    Hallo!!!! WER KANN HELFEN

    Schrei hier bitte nicht rum.

    Suche Quelltext (Filter) um alle bekannten html Code (Befehle) per PHP aus einer Datei zu entfernen.

    1. Hier gibt es keinen fertigen Quelltext
    2. html hat keine Befehle

    strip_tags reicht nicht aus !

    Warum nicht? Was funktioniert mit dieser Funktion nicht?

    Vielleicht helfen dir reguläre Ausdrücke (->http://php.net/ hilft weiter) die alles was <irgendwas> (bzw. </irgendwas> wobei es <irgendwas /> auch noch gibt...) enthalten rauswerfen - allerdings könnte das wiederum über das Ziel hinausschießen.

    Grüße aus Nürnberg
    Tobias

    1. home_cmp_cypress110_vbtn_a.gif"); } -->if(msfphover) { msfpnav2n=msfppreload("_derived ext1001_cmp_cypress110_vbtn.gif"); msfpnav2h=msfppreload("_derived ext1001_cmp_cypress110_vbtn_a.gif"); } -->if(msfphover) { msfpnav3n=msfppreload("_derived armprothesen.htm_cmp_cypress110_vbtn.gif"); msfpnav3h=msfppreload("_derived armprothesen.htm_cmp_cypress110_vbtn_a.gif"); } -->if(msfphover) { msfpnav4n=msfppreload("_derived ortholinks.htm_cmp_cypress110_vbtn.gif"); msfpnav4h=msfppreload("_derived ..............usw........... ist mit Filter zu sehen

      Anders mit Editor von Phase 5 erhalte ich reinen Text
      muss doch auch per PHP machbar sein

      echo $stop1;
      if ($fp=fopen($datei,$modus)) {

      $meta_name   = array();

      while (!feof ($fp)) {

      $datei1=strip_tags($chr);

      $zeile = fgetss($fp, 4096);
      //$zeile = ereg_replace('<([^>]|\n)*>', ',', $zeile);
      $zeile =ereg_replace("/"," ",$zeile);
      $zeile = strtolower($zeile);
      echo $zeile;
       }
       }
      else
        echo "nein";
      if (fclose($fp))
      ";

      usw.. mein Code Ansatz

      1. Hallo,

        home_cmp_cypress110_vbtn_a.gif"); } -->if(msfphover) { msfpnav2n=msfppreload("_derived ext1001_cmp_cypress110_vbtn.gif"); [...]

        Das ist alles nur kein html. (ich würde mal auf frontpage tippen)
        Was du damit jetzt allerdings machen willst (was übrigbleiben soll) weiß ich nicht.

        Anders mit Editor von Phase 5 erhalte ich reinen Text

        hää? Was hat der jetzt damit zu tun? Was machst du mit Phase5?

        muss doch auch per PHP machbar sein

        Was?

        echo $stop1;

        $stop1 ist nicht definiert.

        if ($fp=fopen($datei,$modus)) {

        $datei und $modus auch nicht

        $meta_name   = array();

        was hast du mit $meta_name vor?

        $datei1=strip_tags($chr);

        $chr ist nicht definiert.

        else
          echo "nein";

        ist hier der else-Bereich zu Ende?

        if (fclose($fp))
        ";

        was soll bei fclose passieren? btw: fclose gehört sinnigerweise über else in die if-Abfrage ganz unten rein.

        Grüße aus Nürnberg
        Tobias *verwirrt*

        1. Ok war zu schnell im einfügen und schreiben (Test.php)

            • kann aber nur besser werden - -

          Also nochmal Mein Versuch bzw. Test

          <?php
          $datei ="test.htm";
          $modus = "r";
          echo $stop1; // Stop Wörter =und den es usw.
          if ($fp=fopen($datei,$modus)) {
          ;
          $meta_name   = array(); // nicht vorhanden

          while (!feof ($fp)) {
          //$chr=fgetss($fp);
          $datei1=strip_tags($datei1);
          $zeile = fgetss($fp, 4096);
          //$zeile = ereg_replace('<([^>]|\n)*>', ',', $zeile);
          $zeile =ereg_replace("/"," ",$zeile);
          // $stop    = trim($stop);
          $zeile = strtolower($zeile);
          echo $zeile;
           }
           }
          else
            echo "nein";
          if (fclose($fp))
            echo " <br>
          <br>
          ";
          ?>
          Bei Phase 5 gibt es eine Option mit der man "alle HTML Befehle entfernen kann"
          dieses Ergebnis möchte ich per PHP auch erreichen

          Es sind bestimmt noch ein Fehler im TEST oben (Jeder hat mal angefangen )

          Aber Versuch macht ... einen neuen Versuch

          RW

  3. Hallo!!!! WER KANN HELFEN

    Suche Quelltext (Filter) um alle bekannten html Code (Befehle) per PHP aus einer Datei zu entfernen.
    strip_tags reicht nicht aus !

    Möchte den Textinhalt rausfiltern zum bearbeiten

    Danke schon im vorraus

    RW

    habe was gefunden:

    http://forum.de.selfhtml.org/archiv/2000_3/t16457.htm

    http://www.w3.org/People/Raggett/tidy/clean.c

    Danke nochmal an Alle