Coris: spezielle Zeichen

Hallo,

ich habe folgendes "Problem"...
Und zwar habe ich eine Internet- und Intranet-Seite.
Auf beiden befindet sich der selbe Text, welcher dieses Zeichen š beinhaltet. Internet zeigt das normal an und im Intranet wird mir anstelle diesen Zeichen ein ? angezeigt...

Charset bei beiden ist UTF-8 nur beim Doctype ist ein Unterschied:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <-- Internet-Seite

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <-- Intranet-Seite

Passe ich das im Intranet an dann hauts mir das Layout etwas durcheinander, aber das ? ist trotzdem noch vorhanden... :/

Beide Seiten werden über ein CMS gewartet...

Langsam weiß ich nicht mehr weiter... Muss ich auf dem Server, wo die Seiten hinpubliziert werden etwas einstellen?

Danke im Voraus für die Hilfe :)

  1. Tach!

    Auf beiden befindet sich der selbe Text, welcher dieses Zeichen š beinhaltet. Internet zeigt das normal an und im Intranet wird mir anstelle diesen Zeichen ein ? angezeigt...

    Ein ? oder ein �? Ein Fragezeichen deutet darauf hin, dass eine Umkodierung stattfand, in eine Kodierung, die ein bestimmtes Zeichen nicht enthält. Beispielsweise UTF-8 nach ISO-8859-1, denn in letzterem ist š nicht enthalten. Allerdings ist es in Windows-1252 vorhanden.

    Charset bei beiden ist UTF-8

    Wie hast du das kontrolliert?

    nur beim Doctype ist ein Unterschied: [...]
    Passe ich das im Intranet an dann hauts mir das Layout etwas durcheinander, aber das ? ist trotzdem noch vorhanden... :/

    Wenn es im Intranet das Layout durcheinander haut, verwendest du vermutlich einen neueren IE, bei dem für das Intranet der Kompatibilitätsmodus eingeschaltet ist (Standardeinstellung). Mit dem Zeichenkodierungsproblem hat das aber nichts zu tun.

    Muss ich auf dem Server, wo die Seiten hinpubliziert werden etwas einstellen?

    Erstmal muss die Ursache gefunden werden. Aber generell: ja, von nichts kommt nichts. Literatur dazu: SELFHTML-Wiki: Zeichencodierung

    dedlfix.

  2. Hi!

    Charset bei beiden ist UTF-8 nur beim Doctype ist ein Unterschied:

    Das wird aber der Fehler sein. Bei der Intranetlösung wird irgendwo noch ISO dazwischen sein. Entweder sind die Browser falsch konfiguriert, oder ihr benutzt unterschiedliche Systeme zur Anzeige und das intranetsystem sendet irgendwo nicht UTF-8. HAst Du mal geschaut, was die angeforderte Seite im Header verschickt? Wenn eine andere Datei zum generieren verwendet wird, ist diese auch in UTF-8 kodiert?

    --
    Signaturen sind blöd!
  3. Hi,

    Und zwar habe ich eine Internet- und Intranet-Seite.
    Auf beiden befindet sich der selbe Text, welcher dieses Zeichen š beinhaltet. Internet zeigt das normal an und im Intranet wird mir anstelle diesen Zeichen ein ? angezeigt...

    okay, also stimmt im Intranet die tatsächliche Zeichencodierung des Dokuments nicht mit der Angabe überein. Ein Fragezeichen wird normalerweise dann angezeigt, wenn der Browser UTF-8 erwartet und versucht, die Daten als solches zu interpretieren, und dann eine ungültige Byte-Sequenz findet. Oder wenn das Dokument zwischendurch irgendwann mal von UTF-8 in eine "einfachere" Codierung umgewandelt wurde und dabei einige Zeichen nicht mehr darstellbar sind.

    Charset bei beiden ist UTF-8

    Wirklich? Oder steht das einfach nur als meta-Element drin? Bedenke: Wenn du auf eine Zigarrenkiste "Schwarzpulver" draufschreibst, ist noch lange kein Schwarzpulver drin. Deine Beschreibung des Symptoms deutet stark darauf hin, dass das Dokument im Intranet eben *nicht* UTF-8-codiert ist, sondern nur behauptet, es sei (oder eben unnötigerweise "degradiert" wurde).

    nur beim Doctype ist ein Unterschied:

    Das spielt in diesem Fall keine Rolle.

    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <-- Internet-Seite

    Ah, also Quirks Mode. Das sollte man vermeiden. Dann fangen die Browser nämlich bei kleinen Fehlern oder Unklarheiten an zu raten.

    Passe ich das im Intranet an dann hauts mir das Layout etwas durcheinander

    Gut. Standardkonform wird das Dokument also wie gewünscht angezeigt (vom Codierungsproblem abgesehen). Da solltest du im Internet nach Möglichkeit auch hinkommen.

    aber das ? ist trotzdem noch vorhanden... :/

    Sag ich doch: Die DOCTYPE-Angabe hat nichts mit der Zeichencodierung zu tun.

    Beide Seiten werden über ein CMS gewartet...

    Hmm. Anscheinend werden sie im einen Fall wie gewünscht als UTF-8 gespeichert/generiert, im anderen Fall in irgendeiner anderen Codierung.

    Ciao,
     Martin

    --
    Chef zum Bewerber: Es gibt zwei Dinge, auf die ich allergrößten Wert lege. Das eine ist Sauberkeit! Haben Sie übrigens die Schuhe auf der Matte abgetreten? - Ja, selbstverständlich. - Gut. Das andere ist uneingeschränkte Ehrlichkeit. Übrigens, draußen liegt gar keine Fußmatte.
    Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
  4. hi,

    Langsam weiß ich nicht mehr weiter... Muss ich auf dem Server, wo die Seiten hinpubliziert werden etwas einstellen?

    Prüfe mal den HTTP-Response-Header "Content-Type" was da für ein charset gesendet wird.

    Hotti

    1. Guten Morgen,

      ich habe jetzt mal mit dem Fiddler die Seiten gecheckt.
      Bei der Seite vom Intranet wird noch ISO übergeben und bei der Internet-Seite steht nur text/html...

      und der Dokumentmodus ist auch unterschiedlich -.-' oh man...

  5. @@Coris:

    nuqneH

    Internet zeigt das normal an und im Intranet wird mir anstelle diesen Zeichen ein ? angezeigt...

    Wie wird beim Intranet auf die Seite zugegriffen? Übers Filesystem (file:///…) oder über HTTP von einem (internen) Webserver (http://…)?

    In welcher Zeichencodierung wurde die Datei gespeichert? Welche Zeichencodierung wird im Dokument angegeben ('meta charset'); welche im HTTP-Header? Das kannst du mit einem Tool wie dem W3C Internationalization Checker herausfinden.

    Interessant für dich dürften die Artikel Änderung der Zeichencodierung einer (X)HTML-Seite auf UTF-8 und HTTP-Header überprüfen sein.

    Qapla'

    --
    Wer möchte nicht lieber durch Glück dümmer als durch Schaden klüger werden? (Salvador Dalí)