Moin,
gerne würde ich zwei Reihen, z.B. (a,b,c,d,e) und (a,c,d,b,e) auf "Ähnlichkeit" überprüfen.
Für diese Zwecke habe ich recherchiert und letzten Endes diese Techniken gefunden: Editierabstand, Hamming und verschiedene N-Gramme. Diese machen bei Wörtern wohl Sinn, aber nicht, wenn es sich um Reihen aus Zahlen oder Konstanten handelt.
In meinem Fall geht es nicht um die exakte Übereinstimmung der beiden Reihen. Also es muss nicht zwangsweise Position 1 beider Reihen gleich sein, Pos2 gleich usw., sondern es ist - zwar nicht perfekt (100% gleich), aber - OK, wenn die zweite/Vergleich-Reihe a,c,b,d,e oder a,c,d,b,e lautet.
Äußerst schlecht (0% ähnlich) wäre jedoch e,d,c,b,a oder d,e,a,c,b usw.
Exakt muss die Reihenfolge nicht übereinstimmen, aber möglichst ähnlich sollte sie sein. Für den Fall einer kompletten Übereinstimmung könnten 100% erreicht werden.
Leider konnte ich auch nach langer Suche kein Verfahren hierfür finden. Gibt es dafür keinen "einheitlichen Algorithmus" bzw. nur eigene Lösungen für spezielle Fälle, oder habe ich lediglich falsch gesucht?
Danke