Moin Moin!
Nur ne kurze Nachfrage @ all:
Wie alt sind da die ältesten (selbst) erfassten Daten und wie voll sind die Speicher schon?
Das vergaß ich ganz generell zu fragen für meine kleine Privatanalyse.
Zum Füllstand hab ich ja schon gepostet.
Die ältesten eigenen Dateien, die ich auf die Schnelle gefunden habe, stammen aus 1991, alte Pascal-Sources. Ich hab auch Dateien mit älteren Zeitstempel, die sind aber entweder nicht von mir oder stammen von Rechnern, bei denen das Systemdatum nicht stimmte. Die ältesten Mails stammen aus 1997.
[...] ausgelagert auf CD oder DVD im Lager. Vermutlich sind die CDs unbrauchbar, wenn ich sie eines Tage doch mal wieder brauche.
Vermutlich. CDs und DVDs sind relativ robust, aber ich habe mittlerweile einige beschädigte CDs gesehen. Die häufigsten Ausfälle habe ich bei CD-Rs, gefühlt im Bereich 2% bis 5%, außerdem einige uralte gepresste, billige Musik-CDs, die sich nicht mehr fehlerfrei lesen lassen, auch ein paar gepresste Daten-CDs lassen sich nicht mehr lesen.
Von daher würde ich nicht ausschließlich auf optischen Medien archivieren. Im Profi-Bereich schreibt man immer noch auf Tapes, aber auch das ist nicht optimal. Heise hat da neulich eine Meldung zu einer Studie veröffentlicht, die sich auch mit meinem Erfahrungen deckt:
* Bänder haben Lesefehler, bei schlechter Lagerung nehmen die Fehler drastisch zu.
* Bänder verschleißen.
* Laufwerke verschleißen.
* Bänder werden nicht verifiziert.
* Für alte Bänder sind oft keine Laufwerke mehr vorhanden.
* Sicherungssoftware schreibt propriäte Formate, die nach ein paar Jahren, spätestens mit der nächsten OS-Generation, niemand mehr lesen kann
Dazu kommt, unabhängig vom Medium, dass mit Daten nach Jahren und Jahrzehnten niemand mehr etwas anfangen kann, weil die erzeugende Software schlicht nicht mehr existiert, die Dateiformate nicht dokumentiert sind, und teilweise auch die notwendige Hardware für das Betriebssystem fehlt. Manches kann man noch mit Emulatoren retten, aber wenn irgendeine antike Software unbedingt noch an einem exotischen Interface einen Kopierschutz-Mechanismus erwartet, oder Daten nur auf propriäten Datenträgern vorliegen, hat man ganz schlechte Karten.
Zu einer echten Archivierung gehört ständiges Umkopieren auf neue Medien, und ggf. auch Konvertieren der Daten.
Idealerweise archiviert man Daten gleich in Formaten, die ausführlich dokumentiert und weit verbreitet sind, und deren Schicksal nicht von einem einzelnen Hersteller abhängen. Also Plaintext, Postscript, PDF/A (genau für diesen Zweck definiert), HTML, GIF, PNG, JPEG, CSV, XML. Und wenn man nicht um (propritäre) binäre Formate herumkommt, sollte man die Dokumentation des Formats gleich mit archivieren, in einem leicht lesbaren Format.
Alexander
--
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".