Christoph Zurnieden: Offline Suchmaschine für HTML-Paket

Beitrag lesen

Hi,

Mit dem Suchwort "tokenizer" findet der Ausgangsposter leicht vorgefertigte Tools zur Erzeugung der Wortlisten.

Naja, so ein Dingen hätte ich ihm auch noch geschenkt, wenn er nett gefragt hätte, sowas liegt hier immer rum ;-)

Aber der Hinweis ist nicht schlecht und ich möchte ihn noch erweitern: Wenn man das für eine ganze CD/DVD mit verschiedensten Textformaten (HTML, Word, PDF, wwi) machen möchte (dann zwar eher in Java denn in Javascript, klar, aber die Wortlisten muß man ja trotzdem haben) sollte man eine der gängigen regulären Suchmaschinen bemühen. Nein, nicht Google, Yahoo oder wie sie alle heißen mögen, sondern die dahinterstehende Technik. Einfach mal bei http://freshmeat.net oder http://sourceforge.net/ nachschauen (estraier, swish-e ...). Die schreiben zwar meist in eine DB, aber das sollte ja kein Hinderungsgrund sein.

so short

Christoph Zurnieden