Bei einem Treffer liegen sofort alle zugehörigen Quellen vor. Ein kompletter Tablescan ist nicht nötig. Ausgehend von der Baumstruktur des Index erwarte ich hier eben den Performancegewinn.
Ich auch - aber nur dann, wenn es gelingt, zu verhindern, daß er dafür vollständig eingelesen werden muß. Denn das ist das Langsame an der bisherigen Lösung, nicht das Vergleichen.
Und um das zu schaffen, müßte man eine Cacheing-Strategie programmieren (entweder den Index aufteilen in einen Baum von Dateien inklusive vollständig neuem Schwanzabschneider oder die erwähnte Client-Server-Lösung), und dazu habe ich irgendwie nur begrenzt viel Lust - das liegt einfach ein paar Abstraktionsebenen unterhalb des eigentlichen Themas.
Außerdem: Hier den etablierten Datenbankherstellern Konkurrenz machen zu wollen (sowohl in Sachen Performance als auch Stabilität bei parallelen Zugriffen), fühle ich mich auch nicht annähernd fit genug, und das Ergebnis würde den Aufwand nicht rechtfertigen.