Hi!
Gedanken würde ich mir eher um А Б В Г Д Е Ж З И Й К Л М oder Н machen - oder Millionen anderer Unicode-Zeichen, die sich mit einer 8-Bit-Single-Byte-Codierung nicht abbilden lassen.
Was würde denn passieren, falls solch ein Zeichen auch darin wäre?
Diese Frage lässt auf ein grundlegendes Lernpotential schließen. In einem Zeichensatz sind begrenzt viele Zeichen enthalten. Desweiteren gibt es Kodierungen, die diese Zeichen in nutzbare Form bringen, was Bits und Bytes auf Computern sind. Alle mit der gewählten Kodierung nicht kodierbaren Zeichen lassen sich nicht darstellen - es sei denn, es gibt Ersatzschreibweisen, wie bei HTML. Doch diese machen mehr Arbeit, weil sie stets extra berücksichtigt werden müssen und nicht jedes System darauf eingestellt ist. Deswegen ist es besser, einen Zeichensatz und eine entsprechende -kodierung zu verwenden, die möglichst alles enthält und darstellen kann.
Würde dann mehr passieren, als das irgendein Ersatzzeichen genommen würde oder eine Buchstabenlücke entstände?
Ersatzzeichen (nicht zu verwechseln mit Ersatzdarstellungen wie NCRs/Entitys in HTML) sind generell jeweils nur ein einziges Zeichen, zum Beispiel das Fragezeichen. Aus diesem kann man das ursprüngliche Zeichen nicht wiederherstellen - es ist also verloren.
Lo!