Der Martin: chinesische Schrift in HTML darstellen

Beitrag lesen

Hallo,

ich habe in einer Datenbank im UTF-8_unicode_ci Format chinesische Zeichen gespeichert und möchte diese nun auf dem Bildschirm ausgeben....

Es werden nur Fragezeichen ausgegeben.

das ist ein schlechtes Omen. Fragezeichen sind ein Hinweis darauf, dass nicht einfach die gewünschten Zeichen im verwendeten Font fehlen (denn dann würde ein Ersatzzeichen angezeigt, meistens ein leeres Quadrat). Stattdessen ist irgendwo die Codierung von UTF-8 in irgendeine andere Codierung umgewandelt worden, die diese Zeichen einfach nicht kennt.

Ich habe versucht, wie in Word, die Schriftart SimSun zu verwenden, doch erfolglos.

Ja, das kann nicht helfen; das Kind ist schon viel früher in der Verarbeitungskette in den Brunnen gefallen.

Ich habe etwas davon gelesen, dass ein chinesischer Schriftsatz zu groß sei, um ihn einfach zu verwenden, indem ich die Schriftart ändere, verstanden hab ich aber nicht, was getan werden muss...

Ich muss mich Matthias anschließen: Wichtig ist, dass in der gesamten Verarbeitungskette durchgängig ein Zeichensatz verwendet wird, der auch die chinesischen Zeichen enthält (am besten Unicode). Und eine Codierung, die diese Zeichen auch darstellen kann, also z.B. UTF-8.
Bei einem durchgehend asiatischen Text kann eventuell UTF-16 vorteilhafter sein, weil du dann nur in seltenen Ausnahmefällen mal vier Byte pro Zeichen brauchst (normalerweie nur zwei), in UTF-8 aber oft drei Byte pro Zeichen.

So long,
 Martin

--
"Wenn man ein Proton aufmacht, sind drei Quarks drin."
- Joachim Bublath in der Knoff-Hoff-Show