Moin!
Also, durch das Ding, mit dem man japanisch eiongeben kann, werden die Zeichen eingegeben.
Intern allerdings sind das garkeine japanischen zeichen, sondern einfach nur 5 Ascii Zeichen hintereinander.
Das möchte ich anzweifeln. Zumindest möchte ich aber anmerken, dass sowas reichlich sinnlos wäre:
Es gibt Zeichentabellen für Japanisch. Es ist ja nicht so, dass Computer nur englisch können - die Japaner haben auch ihren Anteil an der elektronischen Revolution. :) Das einzige Problem dürfte sein, dass es dort vielleicht mehrere Standards gibt.
Mir bekannt ist Shift_JIS und eben (als künftig zu benutzender Standard) Unicode. Es macht wirklich Sinn (auch für den Datenaustausch mit Japanern), sich für einen dieser Standards (oder eben einen anderen benutzten und verfügbaren Standard) zu entscheiden. :)
Naja, unabhängig von den 5 ASCII-Zeichen und ihrer Kompatibilität mit Japanern:
Nunja, jedenfalls gibt es für jedes japnaisches Zeichen ein HTML-Code:
&#xxxxx (statt xxxxx die zahl des jap. zeichens sozusagen).
Dieses wird ohne Sprachpaket unterstützt und verwendet normale Zeichen.
Ich möchte nun von den Ascii-Teilen direkt umwandeln in die entsprechenden HTML-Codes.
Mir scheint, du mußt eine Codetabelle entwickeln, in der einem 5-Zeichen-ASCII das zugehörige Unicode-Zeichen zugeordnet ist. Wahlweise meinetwegen auch der &#xxxx; Code. Bedenke aber, dass das &-Zeichen natürlich nicht in & umgewandelt werden darf. :)
Das Erstellen dieser Tabelle dürfte der Einmalaufwand sein. Danach sollte es eigentlich ziemlich simpel ablaufen, indem du eine entsprechende Suchen/Ersetzen-Operation auf deinen Text losläßt.
Bedenke dabei: Es macht wirklich Sinn, wenn du statt der wahnsinnig langen &#xxx;-Abfolgen direkt Unicode-Zeichen ausgibst (beispielsweise als UTF-8 codiert). Die meisten heutigen Browser können das. Alternativ nimm Shift_JIS. Das spart Übertragungskapazität ein.
Unicode-Zeichentabellen findest du auf http://www.unicode.org/.
Hast du zufällig ICQ/AIM/YIM/MSN?
Nein, habe ich nicht, will ich auch nicht. Brauch ich nicht. Die Diskussion findet im Forum statt, wo jeder sie mitkriegt - und wo die Lösung dann hinterher im Archiv steht. Du bist nicht der erste mit fremdsprachlichen Problemen bei Sprachen mit anderen Zeichensätzen, du wirst nicht der letzte sein - aber der nächste hat eine Diskussion mehr, aus der er Informationen ziehen kann.
- Sven Rautenberg
"Bei einer Geschichte gibt es immer vier Seiten: Deine Seite, ihre Seite, die Wahrheit und das, was wirklich passiert ist." (Rousseau)