Pry: Seiten/Dateien algorithmisch Indizieren

Beitrag lesen

Hallo,

ich habe eine große Menge an Daten und bzw Seiten(Html) und möchte die gerne möglichst genau Indizieren und an Informationen ran zu kommen. Gibt es so ne Art google für Dateien oder um Offline zu indizieren?

Es geht mir nicht darum ein Wort oder so zu suchen sondern eine Programm das eine Art Algorithmus nutzt um die Suche zu prizisieren.

Eine Art neuronales Netzwerk würde da vielleicht etwas bringen, gibt es da sowas für Dateien? Also wie gesagt sind HTML Seiten, die aber nicht miteinander verlinkt.

mfg
Pry