Hi Christian,
Die Daten sind aber 1. nicht unbegrenzt weil wir nur ein begrenztes
Vokabular haben (Selfdeutsch und deine "??" ;),Und was hindert mich daran, jeden Tag eine neue Wortschoepfung zu
kreieren? Sorry, aber das ist doch Quatsch. Weder weisst du, wie welcher
Mensch welche Worte schreibst, noch weisst du, welche Wortschoepfungen
eventuell kreiert werden koennen.
Versuche mal ein Posting abzusetzen dass nur aus Neukreationen besteht.
Mein Argument ist das ein Suchalgo auf die Häufigkeitsverteilung von Wörtern/Silben im Archiv/bei der Suche orientiert. Diese wirst du mit gelegentlichen Neukreationen nicht so schnell umstoßen können, es sei denn das Forum entschließt sich spontan z.B. auf finnisch weiterzudiskutieren.
einer 2er-Potenz mehr arbeiten, damit haettest du 32 Bit Hashwerte und
maximal 4294967296 Eintraege a 32 Bit. Damit kaemst du auf 131072MB
fuer die zweite Hash-Tabelle.
Nein nein nein, es geht um verschachtelte Hashtabellen.
Das Primärhash enthält in jeder Zelle einen Verweis auf ein weiteren _neuen_ Hash mit _nur_ den Kollisionen (und zusätzlich natürlich gleich den Hauptwert für den häufigsten (oder die häufigsten) Schlüssel).
Wenns in dieser Zelle nur 256 Kollisonen gibt, ist der neue Hash entsprechend klein, dh. 8 statt 32 bit Hashwerte.
65K war jetzt nur eine Hausnummer die sich am Standardvokabular eines Menschen orientiert, (weniger wär wahrscheinlich auch effektiver), so dass
Abfragen die einen sekundären Hash brauchen möglichst selten sind.
Dein Argument das Hashes nicht dynamisch erweiterbar sind, ist aber damit widerlegt.
Tschau
rolf