Hallo Forum,
Mittlerweile hat sich auf meinen Rechnern eine Recht grosse anzahl dokumente angesammelt. Sowohl HTML (ganze bücher, howtos, dokus) als auch eine Menge PDFs. Ich bin vor kurzen in eine WG gezogen, dadurch hat sich die grösse dieser Sammlung verdreifacht.
Grob über den Daumen gepeilt würde ich den umfang mal auf 30 GB schätzen.
Ich suche nun nach irgendeiner OpenSource lösung um diese daten strukturiert unterzubringen. Wie das genau funktieren soll ist mir nicht ganz klar.
Zur zeit habe ich eine Apache VHost (Linux als OS) der auf das doc verzeichniss zeigt.
Per script generiere ich die ordnerstruktur des docverzeichnisses, alle ordner die mit einem ``!'' beginnen werden "geöffnet" (rekursiv gelisted).
Somit kann ich per WWW auf die kompletten dokus zugreifen.
Das ist ziemlich dirty ;)
Volltextsuche ist auf diesen Weg nichtmöglich, und auch ansonsten gefällt mir das alles nicht so recht.
Wenn es keine Existierendes Scripts gibt (was ich nicht glaube), code ichs auch selber. die suche auf http://sf.net] hat mir nicht wirklich geholfen.
Irgendwelche Ideen?
Also bonus würde ich wollen PDF dateien zb auch als XML oder HTML output zu bekommen... Träume ich? ;)
Mfg entropie
Whenever people agree with me I always feel I must be wrong.
-- Oscar Wilde