Pry: Seiten/Dateien algorithmisch Indizieren

Hallo,

ich habe eine große Menge an Daten und bzw Seiten(Html) und möchte die gerne möglichst genau Indizieren und an Informationen ran zu kommen. Gibt es so ne Art google für Dateien oder um Offline zu indizieren?

Es geht mir nicht darum ein Wort oder so zu suchen sondern eine Programm das eine Art Algorithmus nutzt um die Suche zu prizisieren.

Eine Art neuronales Netzwerk würde da vielleicht etwas bringen, gibt es da sowas für Dateien? Also wie gesagt sind HTML Seiten, die aber nicht miteinander verlinkt.

mfg
Pry

  1. Es gibt (oder gab mal) so eine Art Google für den Desktop. Ich weiß aber nicht mehr wie das genau heißt.
    Das hat jedenfalls Dateien im lokalen Dateisystem indiziert. So wie die Google-Suche es auch macht.

    Es geht mir nicht darum ein Wort oder so zu suchen sondern eine Programm das eine Art Algorithmus nutzt um die Suche zu prizisieren.

    Ich denke der Erfolg deiner Suche hängt stark von dieser Art Algorithmus ab. Was genau soll die denn suchen, wenns keine einzelnen Wörter sind?

    1. Hello,

      Es gibt (oder gab mal) so eine Art Google für den Desktop. Ich weiß aber nicht mehr wie das genau heißt.

      ähm, Google Desktop? :-P

      MfG
      Rouven

      --
      -------------------
      sh:| fo:} ch:? rl:( br:& n4:{ ie:| mo:} va:) js:| de:] zu:| fl:( ss:) ls:& (SelfCode)
      There's no such thing as a free lunch  --  Milton Friedman