cr: backe backe Kuchen ... oder so ähnlich - DMS im eigenbau

Hallo liebes Forum,

ich möchte diesen Thread als Ideensammlung öffnen. Ich habe vor ein DokumentenManagementSystem für dem Privatgebrauch zu erstellen. Das DMS soll über eine Weboberfläche auf dem lokalen Apachen laufen. Ich habe vor mit den Scanner "Plustek M12" zu kaufen. Dieser soll via USB an den Ubuntu 10.10 Rechner angeschlossen werden, auf welchem auch der Apache  läuft.

Folgendes ist die Idee:

Ich nutze die frei programmierbare Taste auf dem Scanner, um Dokumente im PDF Format in ein vorher festgelegtes Verzeichnis abzulegen.

Mehrere Seiten scannt der Scanner in einzelne pdf's, diese sollen dann mittels pdftk (L1) zusammengeführt werden. Anschließend fülle ich ebenfalls mittels pdftk die Meta-Daten der pdf mit dem Autor (Absender dess Dokuments wie z.b. Vodafone), dem Title (Rechnung, allgemeiner Schriftverkehr, ...) und Keywords (darin enthalten nochmals die inhalte aus Autor und Title sowie weitere Keywords zum Dokument, Rechnungsnummer, Kundennummer etc.

Die pds bekommen als Namen den unix-timestamp vom Scanzeitpunkt. Da alle Dokumente zeitnah gescannt werden soll ist so eine Suche nach Zeitraum der Zustellung einfach möglich. Die Weiteren Inhalte sollen über die Meta angaben gesucht werden.

Ich frage mich nun nur ob das mit den Meta-Daten und der Suche zu aufwändig ist bzw ob man anders heran gehen sollte?

L1) http://www.lagotzki.de/pdftk/

Ich bin auf eure Anregungen und Diskussionen gespannt!

Liebe Grüße

Euer cr

  1. hi,

    Ich frage mich nun nur ob das mit den Meta-Daten und der Suche zu aufwändig ist bzw ob man anders heran gehen sollte?

    Die Meta-Daten werden von Hand eingegeben? Damit würde ich einen Index aufbauen, z.B. in einer DB:

    id, date, title, author, description

    Das erleichtert die Suche. Zusätzlich zu den Meta-Angaben im PDF (wie in DB) kommt die id aus der DB, dann kannst Du auch den Index rekonstruieren.

    L1) http://www.lagotzki.de/pdftk/

    Vielleicht kommt dieses Programm schon selbst mit einem proprietären Indexer daher...

    Horst Heizer

    --
    PDFs brennen richtig, wenn sie vorher ausgedruckt werden.
  2. Hallo,

    Ich habe vor ein DokumentenManagementSystem für dem Privatgebrauch zu erstellen.

    och sooo ...
    Ich habe DMS gelesen und gedacht, "Klasse, da will einer Dehnungsmessstreifen selbermachen". Das wäre mal interessant gewesen. Aber so ...

    Nichts für ungut,
     Martin

    --
    Computer funktionieren grundsätzlich nicht richtig.
    Wenn doch, hast du etwas falsch gemacht.
    Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(