Christoph Zurnieden: Offline Suchmaschine für HTML-Paket

Beitrag lesen

Hi,

Man müßte also aufteilen

aber wird das denn nicht bei der offline-Selfsuche auch gemacht?

Ja. Und jetzt stell' Dir mal vor wieviel das wird, wenn man das nicht wort- sondern buchstabenweise machen würde. Richtig teuer sind I/O-Vorgänge. Für jedes eingesparte Dateieinlesen kannst Du in der Zeit so einiges an Rechenarbeit leisten. Evt sogar eine lineare Suche im Wort-Index mit regulären Ausdrücken.

die Index-Dateien sind doch nach Buchstaben sortiert.

Etwas geschickter ist das schon gelöst, aber im Grunde hast Du Recht, ja.

so short

Christoph Zurnieden