Reinhard: MIC (mutual index of coincidence)

Beitrag lesen

Hey trunx,

das sind die häufigkeiten der buchstaben in der englischen sprache (bei dir die werte in language['en']['frequencies']), also a=8.167%=0.08167=p(1), b=1.492%=0.01492=p(2) usw.

Wäre toll wenn wir die MIC Formel mal für den 1. Substring durchgehen könnten.
Substring[0] : WJPOUVPTQVJGCAEGGVGVQQGCKVNRQVIEGPWVOCUCCEVRJJVKD
Buchstabenhäufigkeit : 1 0 5 1 3 0 6 0 1 4 2 0 0 1 2 3 4 2 0 1 2 9 2 0 0 0 ok. a*A(1)+b*B(1)+...+z*Z(1)=0.08167*1+0+...+0 = ?
das ganze durch l(1)=49 dividieren.
dann a*B(1)+b*C(1)+...+z*A(1) = 0+0.01492*5+...+0.00074*1 = ?
auch wieder durch 49 dividieren.
usw. also a*C(1)+..., a*D(1)+..., ...

Toll! Hab mir gerade was zusammen geschrieben und das läuft ziemlich gut. Die Abweichungen meiner Werte von denen in der Tabelle sind minimal. Liegt wohl daran, dass die Buchstabenhäufigkeiten (Englisch), die ich nutze, sich bei vielen Buchstaben geringfügig unterscheidet. Den Hochpunkt bei C bekomme ich aber auch raus.

Danke! Ich feier dich gerade :-)

Reinhard