Hello out there!
Auch hast du keinen Zeichensatz im HTML angegeben, den der Browser benutzen soll, also nimmt er standardmäßig ISO-8859-1, den westeuropäischen Zeichensatz. Dieser hat nur 255 Zeichen.
Nein! Der Zeichensatz für HTML-Dokumente ist _immer_ UCS / Unicode.
Du verwechselst Zeichensatz und Zeichencodierung.
Wenn keine Zeichencodierung angegeben ist, raten Browser ISO 8859-1. (Allerdings „dürfen Benutzerprogramme keinen Standardwert für den »charset«-Parameter annehmen. […] Benutzerprogramme haben auch üblicherweise eine vom Benutzer einstellbare lokale Standardkodierung, die sie anwenden, wenn andere Indikatoren fehlen.“ [HTML401 §5.2.2])
Aber wenn im Quelltext 'ࠕ' steht, ist es völlig egal, in welcher Codierung das Dokument vorliegt*, da die Zeichen '&', '#', 'x', '0', '8', '1', '5', ';' allesamt im Bereich bis U+007F (Basic Latin / „ASCII-Zeichen“) liegen.
Ob das Zeichen U+0815 dann tatsächlich dargestellt wird, hängt freilich davon ab, ob eine etsprechende Schriftart installiert ist.
See ya up the road,
Gunnar
* vorausgesetzt, die Zeichen U+0000 bis U+007F werden durch die Oktettwerte 0 bis 7F codiert.
„Und [dieses Forum] soll […] auch ein Fachforum bleiben und kein Psychologieforum werden.“ (Kirsten Evers)