Auf der Suche nach Material zu einer Suchmaschine mit Burrows-Wheeler-Transformation (so wirds richtig geschrieben, hat auch keienr bemerkt) bin ich auf folgende Diss gestoßen:
Interessanterweise benutzt er auch einen einfach verschachtelten Hash, die Idee ist also gar nicht sooo exotisch.
Soweit ich sehe ist der Unterschied hier, dass er keine unabhängigen Funktionen braucht sondern unterschiedliche Wortbestandteile einfüttert.
Er spaötet dazu die Suffizes der Wörter ab, macht sich also die Struktur der Sprache zu nutze.
BTW: Habe im Netz gelesen dass bei einer Codierung bei der Wörter im ersten Schritt in Prefix, Stamm, Suffix zerlegt werden, und anschließend die n-gramme des Stammes Huffmancodiert werden, eine Kompresionsrate von gigantischen 1.5 Bits/Character der englischen Sprache erzielt werden können. WOW!
Tschau
rolf