Rolf B: Zwei Sonderzeichen sollen nicht durch Zeilenumbruch getrennt werden können

Beitrag lesen

Hallo Gunnar,

Sonderzeichen sind Zeichen, die in einem bestimmten Kontext ein besondere Funktion haben und deshalb gesondert behandelt werden müssen.

Das stimmt nicht - oder ist zumindest Ansichtssache. Die Wikipedia und die von ihr verlinkten Quellen vertreten eine andere Ansicht. Was Du ansprichst, sind Zeichen mit syntaktischer Funktion, oder reservierte Zeichen, die man kontextgerecht maskieren muss, wenn sie diese Funktion nicht wahrnehmen sollen.

(Was die Menge der Zeichen mit syntaktischer Funktion und die Menge der Zeichen, die man maskieren muss, nicht gleichsetzt.)

Sonderzeichen sind ein Sammelbegriff für alle Zeichen außerhalb des normalen Alphabets (wobei "normal" natürlich eine Funktion der verwendeten Sprache ist). Ob Ziffern Sonderzeichen sind oder nicht, wird gelegentlich diskutiert; im ASCII Kontext sind es keine. Ob Umlaute Buchstaben sind oder Sonderzeichen, wird im Deutschen auch diskutiert (im Schwedischen bspw. nicht)

Also: Symbole wie ♂ ♀ sind definitiv Sonderzeichen. Ich kenne keine Sprache, die sie als reguläre Buchstaben nutzt.

Im Gegensatz zu ♂♀ werden bspw. 🧐🤨 auseinandergerissen

Huh?! Ja, ist so, aber wie kommt das? Ich weiß, dass Unicode Joining-Regeln für Zeichen hat, aber wenn ich mir die Zeichenbeschreibungen bei compart.com oder graphemica.com anschaue, sehe ich keinen Unterschied bei den Join-Attributen dieser Zeichen (jg, jt, Join_C) - allerdings ist die Anzeige bei graphemica so riesig und unübersichtlich, dass man da was übersehen kann. Dass ♂♀ in der BMP liegen und die Emojis in Plane 1, bzw. dass sich die einen 16-bittig codieren lassen und die anderen nicht, sollte wohl nicht der Auslöser sein dürfen.

Rolf

--
sumpsi - posui - obstruxi