xenu: UTF8 Formatierungsporblem Problem

Hallo,

folgendes Problem Tritt gerade auf einer unserer Seite auf, alle Sonderzeichen wie Ü,Ä,ß .... werden als FFFB angezeigt.
Ich dachte zuerst das es ein Problem gibt, mit irgendwelchen falschgesetzten Inhalten in der Datenbank oder ähnlichem.
Ich kann ihn selbst aber nicht finden.

Der Seiten Header lautet:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

Auch im FF wird bei Eigenschaften angezeigt:
text/html; charset=UTF-8

Die Datenbank selbst hat auch UTF8 Unicode und wenn ich UTF8_encode oder UTF8_Decode nach dem Select anlege bringen es keine Besserung.

Ideen?

Gruß

xenu

  1. Ist die Seite öffentlich erreichbar? Kannst du du URL nennen? Dann würd' ich mal einen Blick auf die Quellcode-Ausgabe werfen.

    1. Ist die Seite öffentlich erreichbar? Kannst du du URL nennen? Dann würd' ich mal einen Blick auf die Quellcode-Ausgabe werfen.

      Leider nein.

      1. Dann Poste mal bissel mehr Quelltext. Möglicht den kompletten Head, sowie einige Zeilen aus dem Body in denen Umlaute vorkommen.

        1. Dann Poste mal bissel mehr Quelltext. Möglicht den kompletten Head, sowie einige Zeilen aus dem Body in denen Umlaute vorkommen.

          Mein erster versucht

            
          <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">  
          <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="de"><head profile="http://gmpg.org/xfn/11">  
          <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />  
            
          <title>Fachhändler aus Münster auf Fachhandel-vz.de</title>  
            
          <link rel="stylesheet" href="/images/global.css" type="text/css" />  
          <link rel="stylesheet" href="/images/style.css" type="text/css" />  
          <link rel="stylesheet" href="/images/styles.css" type="text/css" />  
          <link rel="stylesheet" href="/images/element.css" type="text/css" />  
          <link rel="stylesheet" href="/images/sidebar.css" type="text/css" />  
            
          <script src="http://maps.google.com/maps?file=api&amp;v=2.x&amp;key=ABQIAAAAQwL_6v6Bx2M382EF3fvs2hTSkoLLCJtXGpzKebgMbR7L23K2VxQyyVwxJPo9BTXyhURZ-vpmJiBd_w" type="text/javascript"></script>  
            
          			  <style type="text/css">  
            
          	    	  v\:* {  
            
          	      	  behavior:url(#default#VML);  
            
          	    	  }  
            
          	          </style></head> <body onunload="GUnload()" id="home">  
            
          <div id="wrapper">
          

          .....

          <a href="/de/M�nster/" rel="bookmark" title="">test</a></h2>  
          			<div class="entry">  
          			<p>stra�e, M�nster</p></div></div>
          

          .....

          1. Möglicherweise diese Zeichen so aus der Datenbank. Schau mal mit PHPMyAdmin drauf. Vielleicht wurde der Inhalt schon falsch importiert.

            1. Guten Morgen Gerd Thomas,

              ich habe gerade mir gerade die Datenbank noch einmal angeschaut, auch hier sind die Daten einwandfrei die Formatierung ist: utf8_general_ci und die Ü / Ä ... sind einwandfrei sichtbar.

              Gruß

              xenu

              Möglicherweise diese Zeichen so aus der Datenbank. Schau mal mit PHPMyAdmin drauf. Vielleicht wurde der Inhalt schon falsch importiert.

  2. @@xenu:

    nuqneH

    folgendes Problem Tritt gerade auf einer unserer Seite auf, alle Sonderzeichen wie Ü,Ä,ß .... werden als FFFB angezeigt.

    Du meinst '�' U+FFFD?

    Auch im FF wird bei Eigenschaften angezeigt:
    text/html; charset=UTF-8

    Da steht wohl auch nur, was im 'meta'-Element als HTTP-EQUIV angegeben ist.

    Die Angabe des Servers hat höhere Priorität. ([QA-CHANGING-ENCODING], Schritt 3) Was gibt der Server an als Zeichencodierung an?

    Um das herauszufinden, gibt es für Firefox das Add-on „Live HTTP Headers“. Oder siehe [QA-HEADERS-CHARSET].

    Qapla'

    --
    Bildung lässt sich nicht downloaden. (Günther Jauch)
    1. Hallo,

      es wird angezeigt:

      Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

      1. @@xenu:

        nuqneH

        es wird angezeigt:
        Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

        Das ist aus dem Request, den der Client zum Server schickt (fängt an mit "GET / HTTP/1.1"), hier irrelevant.

        Von Bedeutung ist der Response, den der Server zum Client schickt ("HTTP/1.x 200 OK"). Was steht dort unter "Content-Type"?

        Dein Quelltextbeispiel zeigt aber, dass das wohl nicht das Problem ist, sondern dass die Zeichen schon falsch im HTML stehen; sie kommen falsch aus der DB.

        Qapla'

        --
        Bildung lässt sich nicht downloaden. (Günther Jauch)
  3. Hi!

    Die Datenbank selbst hat auch UTF8 Unicode und wenn ich UTF8_encode oder UTF8_Decode nach dem Select anlege bringen es keine Besserung.

    Welche Zeichenkodierung benutzt denn Deine Verbindung zum mySQL-Server?

    Wie sieht der HTTP-Header bzgl. der Zeichenkodierung aus?

    off:PP

    --
    "You know that place between sleep and awake, the place where you can still remember dreaming?" (Tinkerbell)