Tach!
Jetzt möchte ich "ähnliche" Rechnungen heraussuchen. Dabei sollen sagen wir mal min. 50 % der Rechnungspositionen übereinstimmen.
Du siehst ja schon, dass die Definition von "ähnlich" sehr variabel ist. Deswegen gibts da auch keine Ähnlichkeitssuche, abseits von auf englischer Aussprache beruhenden Stringvergleichen.
- Ist das mit MySQL eigentlich zu lösen oder komme ich um eine Scriptlösung nicht drum herum?
Prinzipiell kann man mit MySQL mehr oder weniger alle Probleme lösen, die mit Datenmengen zu tun haben: es gibt ja schließlich Stored Procedures.
- Wenn es mit MySQL zu lösen ist, hab ich aktuell leider keinen Lösungsansatz.
Finde (gruppiert natürlich) die Anzahl der Rechnungspositionen. Vergleiche in den Positionen mit einem Selfjoin, und nur für unterschiedliche Rechnungen, Anzahl mit Anzahl und Name mit Name und was auch immer. Die Anzahl der passenden Datensätze kannst du dann mit der Gesamtanzahl pro Gruppe vergleichen.
dedlfix.