Frage zum Wiki-Artikel „Zeichenreferenz“ Unicode
beatovich
- frage zum wiki
hallo
Ich bin immer wieder mal am sondieren, welche Symbole in Unicode heute eine gute Verbreitung / Vertretung in Schriften haben.
Dabei achte ich auch auf die semantische Aussage.
Spontan kam mir die Idee, dass man die angegebene Wiki-Seite eigentlich mit einem Tool ergänzen könnte, um die Unicodes live zu erforschen.
Was denkt ihr darüber?
Auch ja und das <i> hol ich mir natürlich auch noch selber ab.
@@beatovich
die angegebene Wiki-Seite
Ich verstehe den Sinn der Tabellen nicht. Geht es darum, die in HTML benannten Zeichen-Entitäten aufzulisten? Warum sind dann die griechischen Zeichen auf der Seite, aber nicht die kyrillischen? Und wozu die ganzen Zeichen, die keine benannte Entität haben?
LLAP 🖖
hallo
@@beatovich
die angegebene Wiki-Seite
Ich verstehe den Sinn der Tabellen nicht. Geht es darum, die in HTML benannten Zeichen-Entitäten aufzulisten?
Eventuell aus historischen Gründen. Aber wer würde heute noch ausser in einigen Ausnahmen benannte Entities einsetzen?
Warum sind dann die griechischen Zeichen auf der Seite, aber nicht die kyrillischen? Und wozu die ganzen Zeichen, die keine benannte Entität haben?
Wir haben hier das Problem, dass wir über Zeichen nur im HTML Kontext sprechen. Zeichen werden aber auch in anderen Kontexten verwendet. Pflegen wir denn Referenzen in CSS oder JS?
Ich bin da eher für eine Zusammenführung. von mir aus auch da https://wiki.selfhtml.org/wiki/Unicode
Bei einer sinnvollen Unicode-Abfrage sollte ich eigentlich folgendes abfragen können:
Vordefinierte Abfragen können gelistet werden.
Die Ausgabe zu jedem Codepunkt sollte darstellen:
na vielleicht mit kleinerer Kelle anrichten.
(Achtung, bearbeitet)
hallo
So ich habe im Wiki einen irreführenden Link korrigiert. Da hiess es doch tatsächlich Unicode-Tabellen statt HTML-Entitäten!
@@beatovich
Bei einer sinnvollen Unicode-Abfrage sollte ich eigentlich folgendes abfragen können:
- Codepunkt dez
Braucht kein Mensch.
- Eine Glyphe identifizieren
?? Du willst ein Bild eines Zeichens hochladen und gesagt bekommen, welche Zeichen (Plural!) das sein könnten?
- Alle Entities der gleichen Gruppe auflisten
Was meinst du mit Gruppe? Unicode-Block? Zeichenklassen?
- die Browser native Glyphe darstellen,
„Browser native“? Das Aussehen eines Zeichens hängt doch von der Schriftart ab.
- CSS, JS, HTML Ersatzkodes.
Bei jedem Zeichen angeben, dass bspw. U+203D in CSS als \203D
; in JS als \u{203D}
und in HTML als #x203D;
escapet wird?
LLAP 🖖
hallo
@@beatovich
Bei einer sinnvollen Unicode-Abfrage sollte ich eigentlich folgendes abfragen können:
- Codepunkt dez
Braucht kein Mensch.
- Eine Glyphe identifizieren
?? Du willst ein Bild eines Zeichens hochladen und gesagt bekommen, welche Zeichen (Plural!) das sein könnten?
Nein, ein Zeichen, von dem du nur die Glyphe kennst, identifizieren. Da ist nix mit Bildern.
- Alle Entities der gleichen Gruppe auflisten
Was meinst du mit Gruppe? Unicode-Block? Zeichenklassen?
ja Code-Blöcke. Jedoch gibt es auch andere Arten von Gruppen, bzw die Zusammfassung verschiedener Code-Blöcke
- die Browser native Glyphe darstellen,
„Browser native“? Das Aussehen eines Zeichens hängt doch von der Schriftart ab.
Ist ja mal kein widerspruch. Du kannst aber einen Widerspruch daraus machen, wenn du webfonts verwendest.
- CSS, JS, HTML Ersatzkodes.
Bei jedem Zeichen angeben, dass bspw. U+203D in CSS als
\203D
; in JS als\u{203D}
und in HTML als#x203D;
escapet wird?
Mein notepad++ escaped schliessen in russisch für JS:
ru:"\u0437\u0430\u043A\u0440\u044B\u0432\u0430\u0341\u0442\u044C"
Das ist die Frage, wie gross soll die Kelle sein.
@@beatovich
- Eine Glyphe identifizieren
?? Du willst ein Bild eines Zeichens hochladen und gesagt bekommen, welche Zeichen (Plural!) das sein könnten?
Nein, ein Zeichen, von dem du nur die Glyphe kennst, identifizieren. Da ist nix mit Bildern.
Dann verstehe ich nicht, wie du „eine Glyphe identifizieren“ meinst.
- die Browser native Glyphe darstellen,
„Browser native“? Das Aussehen eines Zeichens hängt doch von der Schriftart ab.
Ist ja mal kein widerspruch. Du kannst aber einen Widerspruch daraus machen, wenn du webfonts verwendest.
Dazu braucht man keine Webfonts. Ein a sieht schon in verschiedenen Systemschriften unterschiedlich aus: einstöckig vs. zweistöckig. g ebenfalls: zweistöckig vs. dreistöckig.
LLAP 🖖
hallo
Dann verstehe ich nicht, wie du „eine Glyphe identifizieren“ meinst.
Was ist das für ein Zeichen?
ښ
Dazu braucht man keine Webfonts. Ein a sieht schon in verschiedenen Systemschriften unterschiedlich aus: einstöckig vs. zweistöckig. g ebenfalls: zweistöckig vs. dreistöckig.
Ja, aber mindestens weiss der User, dass mindestens ein eigener Font die Glyphe rendert.
@@beatovich
Dann verstehe ich nicht, wie du „eine Glyphe identifizieren“ meinst.
Was ist das für ein Zeichen?
ښ
Ein arabisches?
Mehr kann ich dazu nicht sagen. Wie soll ich’s rausfinden? Alle arabischen Zeichen ansehen und das Aussehen vergleichen?
Und wenn ich nicht wüsste, dass es sich um ein arabisches Zeichen handelt?
Und wenn es ein CJK-Zeichen wäre?
Mir schwant was: du meinst nicht „eine Glyphe identifizieren“, sondern ein Zeichen identifizieren?
Text rein, Codepoints (plus weitere Informationen zu den Zeichen) raus.
LLAP 🖖
@@Gunnar Bittersmann
Text rein, Codepoints (plus weitere Informationen zu den Zeichen) raus.
Sowas wie UniView?
Willst du das jetzt nachbauen oder schmollend darauf verlinken? 😉
LLAP 🖖
hallo
Willst du das jetzt nachbauen oder schmollend darauf verlinken? 😉
Ehrlich gesagt, ein Nachbau ist so was von aufwändig, dass man durchaus einfach verschiedene Tools verlinken kann.
Bierideen sind real und kein Gerücht.
Hi,
hab schon paarmal Anlauf genommen, z.b. mit meiner Unicode Character Database die auch einen Webservice zur Verfügung stellt. Schläft aber immer wieder regelmäßig ein 😉
Problem ist die Maintainance, es gibt sehr viele Abhängigkeiten die schwer zu durchschauen sind, siehe auch die Perlmodule unter Unicode
die haben dasselbe Problem.
MfG
hallo
hab schon paarmal Anlauf genommen, z.b. mit meiner Unicode Character Database die auch einen Webservice zur Verfügung stellt. Schläft aber immer wieder regelmäßig ein 😉
Problem ist die Maintainance, es gibt sehr viele Abhängigkeiten die schwer zu durchschauen sind, siehe auch die Perlmodule unter
Unicode
die haben dasselbe Problem.
Wenn ich das da https://mathiasbynens.be/notes/javascript-unicode lese, denke ich, ich hatte einfach mal wieder eine Bieridee
Problem ist auch, dass es keine JS-Methoden gibt, um irgendwelche Informationen zu Codepunkten abzufragen.