cayaphas: utf8_unicode_ci - "character equalities"

Beitrag lesen

tach nochmal ...

Ein Zeichensatz ist eine Ansammlung von Zeichen, z.B. das Alphabet A-Z. Eine Zeichenkodierung ist eine Zuordnung der Zeichen zu einem Wert. Eine Kollation ist ein Satz Regeln zum Vergleichen von Zeichen in einem Zeichensatz.

ok .. aber genau dieser satz von regeln für eine bestimmte collation, existiert die als table für jede collation oder in welcher art und weise kann man diese regeln einsehen ?
Überall findet man character set - tables zu sämtlichen collations, aber eine auflistung der Vergleichs-regeln finde ich nirgends.
ich stell mir das im Moment so vor:
e = é = è
a = á = à
etc.
(lieg ich damit in etwa richtig, oder werden diese vergleichs regeln in einer anderen art und weise abgespeichert oder irgendwie aus dem binary code abgeleitet?)

Bei mir dreht es sich speziell um die utf8_unicode - collation.

Wie schon gesagt, ich würde gerne einsehen, welche characters als equal angesehen werden.

gruss
caya