ASCII Zeichen für jap. zeichen in HTML-Codes umwandeln?
Michael A. Völkel
- php
Hallo. :(
Naja, das Thema ist schlecht formuliert.
Wenn man mit einem IME jap. Zeichen schreibt (wie es auch die Japaner tun), dann erscheinen etwa 2-5 ASCII-Zeichen, welche ein Kana oder Kanji darstellen sollen.
Wenn man das Sprachpaket und das richtige Meta-tag gesetzt hat klappt es zwar, aber das wird eigentlich nur bei jap. Seiten gemacht, außerdem sind dann die Umlaute und sonstige romanische zeichen verkehrt.
Man wird zudem aufgefordert ein Sprachpaket zu installieren.
Nun habe ich herausgefunden, dass manche Foren automatisch die jap. Zeichen, die rauskommen:
Beispiel:
in die dazugehörigen � (statt 00000 die jeweilige Zahl) umformen!
Dadurch können jap. Zeichen dargestellt werden und man wird nicht aufgefordert.
Wie kann ich eine Umwandlung von den Dingern in die HTML-Codes in PHP veranlassen?
Das unterstützen doch einige Foren (Beispiel: www.c-plusplus.de).
Danke im Voraus!
MfG MAV
Hallo. :(
Hi :-)
Ich verstehe nicht so ganz was du eigendlich machen willst. was willst du in den HTML-Code schreiben und wie wird ein ja.Zeichen daraus?
möchtest du in php in einer zeichenkette nach etwas suchen und das dann ersetzen?
Wenn man mit dem IME etwas schreibt...
Ne, anders.
Schau ruhig mala uf eine jaopanische Seite.
Dort werden im Quelltext viele komische Ascii-Zeichen dargestellt.
Das ist eine Möglichkeit, allerdings wird dann jeder Benutzer aufgefordert ein jap. Sprachpaket zu installieren.
Diese komischen Ascii-Zeichen hätte ich gerne direkt umgewandelt in die HTML-Codes, wie: 浃.
Die HTML-Codes werden dann als japanische Zeichen angezeigt, und es ist kein Sprachpaket zu installieren.
Warum es die Japaner nicht selber verwenden ist klar, denn Ascis sind nunmal insgesamt kleiner.
Ich will jedoch kein jap. Forum aufbauen, sondern lediglich die Möglichkeit dazu geben.
Ich habe das schon einmal in manchen Foren gesehen, dass mit dem IME (das zur Schrift auch japaner am PC benutzen (oder ähnliches)) Ascii-Zeichen entstehen (werden vorerst allerdings auch als jap. Zeichen angezeigt), die auch in diese HTML-Codes umgeändert werden.
Diese Umwandlung will ich halt hinbekommen.
MfG MAV
Moin!
Wenn man mit einem IME jap. Zeichen schreibt (wie es auch die Japaner tun), dann erscheinen etwa 2-5 ASCII-Zeichen, welche ein Kana oder Kanji darstellen sollen.
Wenn man das Sprachpaket und das richtige Meta-tag gesetzt hat klappt es zwar, aber das wird eigentlich nur bei jap. Seiten gemacht, außerdem sind dann die Umlaute und sonstige romanische zeichen verkehrt.
Wenn du dir mal die japanische Version von SelfHTML angucken willst - da wird dir zumindest demonstriert, wie beide Zeichensätze (europäisch und japanisch) parallel genutzt werden können.
- Sven Rautenberg
Ich kenne die Seite.
Wie alle jap. Seiten aber, verwendet sie eigentlich auch japanisch.
Außerdem kann ich nicht zulassen, dass jedes Ascii-Zeichen in der DB gespeichert wird, weil man nicht selber die jap. Zeichen schreiben darf.
Parallel genutzt werden sie, aber funktionieren tut das nur mit Sprachpaket und Umlaute sind AFAIK auch nicht verfügbar.
Danke trotzdem.
MfG MAV
Moin!
Ich kenne die Seite.
Wie alle jap. Seiten aber, verwendet sie eigentlich auch japanisch.
Außerdem kann ich nicht zulassen, dass jedes Ascii-Zeichen in der DB gespeichert wird, weil man nicht selber die jap. Zeichen schreiben darf.
Parallel genutzt werden sie, aber funktionieren tut das nur mit Sprachpaket und Umlaute sind AFAIK auch nicht verfügbar.
Ich versteh' leider immer noch nicht, was du wirklich willst. Anscheinend hast du es noch nicht so erklärt, dass ich es verstanden habe.
Ich fasse zusammen: Du gibst Japanisch in deine Tastatur ein. Ok, nicht direkt japanisch, sondern eine Version, die mithilfe von einer Software erst in japanisch transformiert wird, aber letztendlich hast du auf deinem Monitor dann japanisch stehen.
Und diese Zeichen, eingetippt in eine Textarea, willst du irgendwo hinsenden, um sie mit PHP auszuwerten, bzw. in Unicode (das, was du mit � bezeichnet hast) umzuwandeln.
Frage: Hast du, wie in http://selfhtml.teamone.de/html/formulare/definieren.htm#zeichensaetze erwähnt, versucht, deinem Formular das Encoding mitzugeben. Nach meinen (zugegeben geringen) Erfahrungen mit diesem Forum hier sollte die Angabe "utf-8" dafür sorgen, dass der Browser die Codierung in Unicode mehr oder weniger direkt ausführt. Wenn du die dynamischen Seiten mit dem gleichen Encoding auslieferst, sollte es doch gehen, oder? Ganz ohne Wandlung (UTF-8 ist nach meinem Wissen extra dafür konzipiert, Unicode-Zeichen in 8-Bit-Umgebungen zu halten).
Was das ganze Gefasel von einem "Sprachpaket herunterladen" sein soll, hab' ich auch noch nicht verstanden. Die japanischen Self-Seiten und viele andere Seiten mit fremdartigen Zeichensätzen zeigt mein Opera-Browser jedenfalls ganz prima an.
- Sven Rautenberg
Erstmal Danke für deine Geduld und Hilfe. :)
Also, durch das Ding, mit dem man japanisch eiongeben kann, werden die Zeichen eingegeben.
Intern allerdings sind das garkeine japanischen zeichen, sondern einfach nur 5 Ascii Zeichen hintereinander.
Es ist nicht möglich, das direkt zu speichern, da ich html_entities nutze und dadurch alle Zeichen automatisch in ihre HTML-Umwandlungen geformt werden.
Also z.B.: & zu & etc.
Nunja, jedenfalls gibt es für jedes japnaisches Zeichen ein HTML-Code:
&#xxxxx (statt xxxxx die zahl des jap. zeichens sozusagen).
Dieses wird ohne Sprachpaket unterstützt und verwendet normale Zeichen.
Ich möchte nun von den Ascii-Teilen direkt umwandeln in die entsprechenden HTML-Codes.
:\
Hast du zufällig ICQ/AIM/YIM/MSN?
Dann könnten wir das da besprechen.
Meine Daten:
ICQ: 167950180
AIM: Mis2comX
YIM: Mis2com
MSN: Mis2comX@hotmail.com
MfG MAV
Moin!
Also, durch das Ding, mit dem man japanisch eiongeben kann, werden die Zeichen eingegeben.
Intern allerdings sind das garkeine japanischen zeichen, sondern einfach nur 5 Ascii Zeichen hintereinander.
Das möchte ich anzweifeln. Zumindest möchte ich aber anmerken, dass sowas reichlich sinnlos wäre:
Es gibt Zeichentabellen für Japanisch. Es ist ja nicht so, dass Computer nur englisch können - die Japaner haben auch ihren Anteil an der elektronischen Revolution. :) Das einzige Problem dürfte sein, dass es dort vielleicht mehrere Standards gibt.
Mir bekannt ist Shift_JIS und eben (als künftig zu benutzender Standard) Unicode. Es macht wirklich Sinn (auch für den Datenaustausch mit Japanern), sich für einen dieser Standards (oder eben einen anderen benutzten und verfügbaren Standard) zu entscheiden. :)
Naja, unabhängig von den 5 ASCII-Zeichen und ihrer Kompatibilität mit Japanern:
Nunja, jedenfalls gibt es für jedes japnaisches Zeichen ein HTML-Code:
&#xxxxx (statt xxxxx die zahl des jap. zeichens sozusagen).
Dieses wird ohne Sprachpaket unterstützt und verwendet normale Zeichen.
Ich möchte nun von den Ascii-Teilen direkt umwandeln in die entsprechenden HTML-Codes.
Mir scheint, du mußt eine Codetabelle entwickeln, in der einem 5-Zeichen-ASCII das zugehörige Unicode-Zeichen zugeordnet ist. Wahlweise meinetwegen auch der &#xxxx; Code. Bedenke aber, dass das &-Zeichen natürlich nicht in & umgewandelt werden darf. :)
Das Erstellen dieser Tabelle dürfte der Einmalaufwand sein. Danach sollte es eigentlich ziemlich simpel ablaufen, indem du eine entsprechende Suchen/Ersetzen-Operation auf deinen Text losläßt.
Bedenke dabei: Es macht wirklich Sinn, wenn du statt der wahnsinnig langen &#xxx;-Abfolgen direkt Unicode-Zeichen ausgibst (beispielsweise als UTF-8 codiert). Die meisten heutigen Browser können das. Alternativ nimm Shift_JIS. Das spart Übertragungskapazität ein.
Unicode-Zeichentabellen findest du auf http://www.unicode.org/.
Hast du zufällig ICQ/AIM/YIM/MSN?
Nein, habe ich nicht, will ich auch nicht. Brauch ich nicht. Die Diskussion findet im Forum statt, wo jeder sie mitkriegt - und wo die Lösung dann hinterher im Archiv steht. Du bist nicht der erste mit fremdsprachlichen Problemen bei Sprachen mit anderen Zeichensätzen, du wirst nicht der letzte sein - aber der nächste hat eine Diskussion mehr, aus der er Informationen ziehen kann.
- Sven Rautenberg
Nein, habe ich nicht, will ich auch nicht. Brauch ich nicht. Die Diskussion findet im Forum statt, wo jeder sie mitkriegt - und wo die Lösung dann hinterher im Archiv steht. Du bist nicht der erste mit fremdsprachlichen Problemen bei Sprachen mit anderen Zeichensätzen, du wirst nicht der letzte sein - aber der nächste hat eine Diskussion mehr, aus der er Informationen ziehen kann.
- Sven Rautenberg
Mir geht es ja nur darum, dass der Thread schon ganz am Ende der Seite ist und ich immer irre lange suchen muss, um ihn zu finden.
Also, gibt es nicht eine vorgefertigte FUnktion, die das so macht?
Das mit dem Unicode schau ich mir mal an.
MfG MAV
Also ich habe in den Header jetzt den Code eingebunden:
<head> <-- das mein ich jetzt mit header
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
</head>
Leider werden die entsprechenden Zeichen nicht zu jap. Zeichen!
MfG MAV
Ach übrigens.
Es funktioniert nur, wenn der jeweilige Mensch das Sprachpaket jap. installiert hat.
MfG MAV