Hi,
ein knappes MB :) Oder scklucken deine Oktets 1KB?
Da steht nix von Gigabyte, da steht nur Gig. Ein Gigabit würde z.B. passen.
leider auch nicht weil 3 Dezimalstellen 10 Binärstellen braucht (1024) und ein Byte nur 8 derselben hat :)
Wer sagt denn das ein Byte 8 Bit hat?
Ne ne, nach zwei Glas Sekt komme ich schonmal auf dumme Scherze, aber das reicht noch lange nicht dafür, Lücken im Konzept zu haben ;-)
Aber in solche Fallen kann man an Neujahr schon mal tappen; genauso, wie sie zu Sylvester gerne mal gestellt werden - in der Sektlaune ;-)
Hei man it's Silvester not Sülvester! *fg*
Nein, Sylvester war schon richtig ;-)
Ich denke Hashtabllen sind ziemlich unschlagbar.
Hashtabellen sind nur dann erfolgreich, wenn alle, und ich meine _alle_, Daten vorher bekannt sind.
Die Wörter der deutschen Sprache sind bekannt ...
Das sag' mal den Postern hier ;-)
Die Frage wie man effektiv enthaltene Wortteile sucht, macht mir mehr sorgen. Wie macht es die DB?
"It depends" könnte man sagen, oder weniger höflich:"See the source, Luke!"
Wenn es aber um die Vergleiche im Baum selber geht: da ist es bei Strings z.B. ein mehr oder weniger geschicktes strstr(). Das macht es ja auch so aufwendig. Ein "*foo*" würde z.B. im schlimmstem Falle jeden Knoten anfassen müssen.
Nein, eine simple Wortindizierung bringt es einfach nicht.
Nun es reicht ein Histogramm der Buchstaben- oder Silbenverteilung
im Archiv um ne effektive und stabile Hashfkt zu basteln, die einerseits ins RAM passt und Rechtschreibfehlertolerant ist.
Sowas gibts bestimmt schon irgendwo fertig ausgearbeitet.
Nicht das ich wüßte.
<I>? >;->
so short
Christoph Zurnieden