Hallo,
Ich möchte aber diese Datenbank über PHP auslesen, d.h. ich nutze dies hier:
$fe = "http://www.chineseetymology.org/Etymology.aspx?characterInput=$e[11]&submitButton=Analyze+Character";
@ $byte = file($fe);
zerlege dann die eingelesene Seite und extrahiere daraus, was ich brauche (das ist vom Betreiber dieses Lexikons auch abgesegnet).
Mache ich das, wird aus den Quadraten - kurz gesagt - Mist, nämlich jeweils zwei Sonderzeichen (è€) und schon wieder so ein Quadrat.
Wie extrahiersrt Du? Wie gibst Du das extrahierte wieder aus?
Du musst beachten, dass die eingelesenen Daten UTF-8 codiert sind. Das Zeichen "續" U+7E8C besteht also aus _drei_ Bytes. Solange Du das bei Deiner Verarbeitung berücksichtigst und nicht auseinanderreißt und die Ausgabe auch wieder als UTF-8 kenntlich machst, sollte es funktionieren.
viele Grüße
Axel