Hi Christian,
ich fange mal hier an, in den Thread hinein zu kommentieren ... (den meisten Deiner Aussagen kann ich eh nur zustimmen)
Also wird beim MySQL Volltext irgendwie ein binärer Baum
auf der Festplatte gespeichert,
Unwahrscheinlich. Eher ein B-Baum.
Vermutlich hast Du recht - aber für die aktuelle Diskussion ist das gar nicht wirklich wichtig. Es bestimmt, zu welcher Basis der Logarithmus gebildet wird ... mehr nicht. Deshalb habe ich zur Veranschaulichung jeweils binäre Bäume verwendet. (Natürlich ist innerhalb einer Index-Seite Platz für mehr als zwei Tochterknoten.)
Aber das müßte doch tierisch schnell sein,
Nicht zwingend. Bei unguenstigen Daten kann der Baum halt
sehr schnell degenerieren.
Das ist ein Aspekt des Betriebskonzepts der Anwendung.
Wenn in diesem Baum nur sehr selten eingefügt oder gelöscht wird, dann bleibt seine Struktur relativ stabil, wenn diese am Anfang einmal sinnvoll[tm] erzeugt wurde.
Und auch hierfür ist es besser, zuerst alles Datensätze einzufügen und danach ein CREATE INDEX hinterher zu schießen (was sicherlich auch schneller ist, aber massiv Ressourcen anfordert).
Viele Grüße
Michael
T'Pol: I meant no insult.
V'Lar: Of course not. You're simply speaking your mind ... as you always have.