Hi!
Jedes Zeichen, für das kein Glyph in der verwendeten Schriftart gefunden wird, wird als genau ein Kasten dargestellt.
Streng korinthenkackerisch können auch mehrere Zeichen ein Graphem bilden, für dass es dann in der Schriftart kein Zeichen gibt. Wobei der Unicode Last Resort Font tatsächlich für nicht selbst stehende, also z.B. kombinierende Zeichen doch ein Ersatz anzeigt. Hm.
Ich denke, das liegt daran, dass ein Font, wenn er keinen Glyphen für ein bestimmtes Zeichen hat, auch die dazugehörigen Regeln zur Kombination nicht enthalten wird. Und die anzeigenden Programme holen sich solche Infos afaik aus dem Font, d.h. die wissen dann auch nicht, dass sich da was kombinieren sollte.
Ein anderer Fall, wo man zwei Kästen für ein Zeichen bekommen könnte, wären Surrogates, wenn das anzeigende Programm/System Codepoints > 0xFFFF nicht versteht. Dieser Fall sollte aber langsam aussterben.
Viele Grüße,
Alex