Tolwin: HTML Tags werden klartextlich dargestellt

Hallo Forum,

ich habe ein kleins Problem mit der Darstellung von Text der mir im
UTF-8 Format geliefert wird. Per htmlenities() wird der Text mit allen Umlauten
richtig dargestellt - allerdings zeigt er nun auch HTML Tags in Klartext an.
Hab schon einige Funktion
wie htmlspecialchars() verwendet, hatte aber leider nicht geklappt.
Kann mir jemand sagen wie ich die Tags aus dem Text bekommen?

Danke und Grüße
Tolwin

  1. hi,

    ich habe ein kleins Problem mit der Darstellung von Text der mir im
    UTF-8 Format geliefert wird.

    Du willst die Daten also in einer Seite mit anderer Kodierung darstellen lassen?

    Per htmlenities() wird der Text mit allen Umlauten
    richtig dargestellt - allerdings zeigt er nun auch HTML Tags in Klartext an.
    Hab schon einige Funktion
    wie htmlspecialchars() verwendet, hatte aber leider nicht geklappt.
    Kann mir jemand sagen wie ich die Tags aus dem Text bekommen?

    Wandle nicht in Entities um, sondern ändere die Kodierung.
    utf8_decode, iconv-Funktionen.

    Alternativ: Nutze gleich UTF-8 auch bei deiner Seite :-)

    gruß,
    wahsaga

    --
    /voodoo.css:
    #GeorgeWBush { position:absolute; bottom:-6ft; }
    1. P.S.:

      Wandle nicht in Entities um, sondern ändere die Kodierung.
      utf8_decode, iconv-Funktionen.

      Dass dabei natürlich in der Zielkodierung nicht darstellbare Zeichen verloren gehen (bzw. zu ? werden dürften), sollte klar sein.
      Wäre zu klären, ob solche Zeichen nicht vorkommen können, oder ob das in Kauf genommen werden kann.

      gruß,
      wahsaga

      --
      /voodoo.css:
      #GeorgeWBush { position:absolute; bottom:-6ft; }
    2. Wandle nicht in Entities um, sondern ändere die Kodierung.
      utf8_decode, iconv-Funktionen.

      Hallo wahsaga,
      hab das eben mal versucht. utf8_encode() liefert mir das gleich
      Ergebnis. Die Umlaute werden richtig dargestellt, allerdings auch
      noch immer die HTML Tags. iconv kann ich nicht verwenden und die
      Seite muss in ISO bleiben. Gibts noch einen Lösungsweg ohne auch RegEx zurückgreifen zu müssen?

      Danke und Gruß
      Tolwin

      1. hi,

        hab das eben mal versucht. utf8_encode() liefert mir das gleich
        Ergebnis.

        en- ist ja auch die falsche Richtung.

        gruß,
        wahsaga

        --
        /voodoo.css:
        #GeorgeWBush { position:absolute; bottom:-6ft; }
        1. en- ist ja auch die falsche Richtung.

          decode funktioniert garnicht... mit encode zeigt er mir die
          richtigen Umlaute....

          Tolwin

          1. hi,

            decode funktioniert garnicht... mit encode zeigt er mir die
            richtigen Umlaute....

            Dann stimmt irgendwas an deiner Beschreibung des Sachverhaltes nicht.

            gruß,
            wahsaga

            --
            /voodoo.css:
            #GeorgeWBush { position:absolute; bottom:-6ft; }
            1. Dann stimmt irgendwas an deiner Beschreibung des Sachverhaltes nicht.

              Du hast recht,

              war ein Denkfehler meinerseits, sorry.
              Das Problem ist folgendes - die HTML Seite in der die
              Texte im ISO Format eingebunden werden ist in UTF-8, daher
              funktioniert das auch mit encode ...

              Die Überschriften werden nun sauber umgesetzt, allerdings sieht
              man immer noch die HTML Tags wie im nachfolgendem Bsp.

              <P>Im folgenden möchten wir Sie über die letzten <STRONG>wesentlichen Aktualisierungen</STRONG> auf unseren Seiten ...

              Wie bekomme ich diese mit kleinem Aufwand da raus? Konnte im
              Web nix passendes finden....
              Grüße
              Tolwin

              1. hi,

                Das Problem ist folgendes - die HTML Seite in der die
                Texte im ISO Format eingebunden werden ist in UTF-8, daher
                funktioniert das auch mit encode ...

                Also bekommst du Daten in ISO-irgendwas, und willst sie in UTF-8 ausgeben/darstellen.

                Die Überschriften werden nun sauber umgesetzt, allerdings sieht
                man immer noch die HTML Tags wie im nachfolgendem Bsp.

                Hast du jetzt nur in UTF-8 umkodiert?
                Das würde ja bedeuten, dass die spitzen Klammern bereits in den Eingabedaten, die du bekommst, maskiert sein müssten.
                Das könnte ein vorheriges html_entity_decode() zwar rückgängig machen - aber dann würden auch &lt; und &gt;, die keine HTML-Elementbegrenzer darstellen sollen, in < und > umgewandelt.

                gruß,
                wahsaga

                --
                /voodoo.css:
                #GeorgeWBush { position:absolute; bottom:-6ft; }
                1. Hast du jetzt nur in UTF-8 umkodiert?
                  Das würde ja bedeuten, dass die spitzen Klammern bereits in den Eingabedaten, die du bekommst, maskiert sein müssten.
                  Das könnte ein vorheriges html_entity_decode() zwar rückgängig machen - aber dann würden auch &lt; und &gt;, die keine HTML-Elementbegrenzer darstellen sollen, in < und > umgewandelt.

                  Folgendes habe ich nun versucht:

                  $string_uml = html_entity_decode(utf8_encode ($string));

                  aber angezeigt wird noch immer

                  <P align=left>Bereits kurz nach dem Start&nbsp;des <STRONG>blabla</STRONG> konnte uns ...

                  angezeigt. Kann mir das nicht erklären...

                  Gruß
                  Tolwin

                  1. hi,

                    Kann mir das nicht erklären...

                    Dann erklär's uns doch bitte wenigstens mal nachvollziehbar.

                    Wie genau sehen denn die Daten aus, die du bekommst?

                    gruß,
                    wahsaga

                    --
                    /voodoo.css:
                    #GeorgeWBush { position:absolute; bottom:-6ft; }