GiovanniRena: Zukunftsicheres Dateiformat

0 45

Zukunftsicheres Dateiformat

GiovanniRena
  • sonstiges
  1. 0
    Ludger Keitlinghaus
    1. 0
      Tom
      1. 0
        GiovanniRena
        1. 0
          Käsebär
          1. 0
            GiovanniRena
          2. 0
            GiovanniRena
  2. 0
    Danny
    1. 0
      Ergänzung
      1. 0
        Chris
        1. 0
          Danny
          1. 0
            GiovanniRena
    2. 0
      GiovanniRena
      1. 0
        at
  3. 0
    Konrad L. M. Rudolph
    1. 0
      GiovanniRena
      1. 0
        Konrad L. M. Rudolph
  4. 0
    Christoph Zurnieden
    1. 0
      GiovanniRena
      1. 0
        Konrad L. M. Rudolph
        1. 0
          Christoph Zurnieden
          1. 0
            GiovanniRena
            1. 0
              dbenzhuser
              1. 0
                GiovanniRena
                1. 0
                  Konrad L. M. Rudolph
            2. 0
              Christoph Zurnieden
          2. 0
            Konrad L. M. Rudolph
            1. 0
              Christoph Zurnieden
    2. 0
      molily
      1. 0
        Christoph Zurnieden
        1. 0
          at
          1. 0
            molily
            1. 0
              MudGuard
  5. 0
    Gunnar Bittersmann
    1. 0
      Christoph Zurnieden
      1. 0
        Konrad L. M. Rudolph
        1. 0
          Christoph Zurnieden
  6. 0
    dbenzhuser
  7. 0
    Thomas J.S.
    1. 0
      Thomas Jungkind
      1. 0
        GiovanniRena
      2. 0
        Thomas J.S.
    2. 0
      Ludger Keitlinghaus
      1. 0
        Thomas J.S.
  8. 0
    Mathias Bigge

Hallo,

als ich mit EDV begonnen habe, hab ich sehr viele Texte in Winword-Dokumenten gespeichert. Nun, fast 10 Jahre nach der ersten Datei hab ich mir Gedanken um die Zukunftssicherheit gemacht.
Ich denke solch ein spezifisches Format (von der Firma MS in diesem Fall) ist nicht gut, es sollte ein allgemeines Format sein. Wie z. B. PDF, HTML oder TXT.

TXT -> ist wohl die portabelste Lösung, im Klartext in Datei gespeichert, allerdings ohne Formatierung

HTML -> ist auch sehr portabel, der Inhalt ist leicht aus der Datei zu lesen (auch ohne Browser), sieht aber nicht auf jedem Bildschirm 100% gleich aus

PDF -> ist auch portabel, der Inhalt wird immer gleich dargestellt

Am liebsten wäre mir PDF, ich denke es ist die bessere Wahl wie DOC, RTF oder TXT. Allerdings ist HTML/XML vielleicht doch etwas besser? Was meint ihr? Oder gibt es ein noch zukunftsicherereres Format, auf das man auch noch in 20 Jahren bauen kann? Mir wäre halt besonders wichtig, dass die Daten gute 15 Jahre überdauern können.

Gruß Giovanni

  1. Hi,

    Am liebsten wäre mir PDF, ich denke es ist die bessere Wahl wie DOC, RTF oder TXT.

    wenns auch mal gedruckt werden soll, dann PDF.

    Allerdings ist HTML/XML vielleicht doch etwas besser?

    Gehoert keinem, waere also schon irgendwie besser.

    Was meint ihr? Oder gibt es ein noch zukunftsicherereres Format, auf das man auch noch in 20 Jahren bauen kann?

    Das wuerde wiederum fuer "TXT" sprechen.   ;-)

    Mir wäre halt besonders wichtig, dass die Daten gute 15 Jahre überdauern können.

    Wenns unformatiert sein darf und Ueberdauerbarkeit, dann muss es "TXT" sein. Man weiss ja nie ob es dann noch lauffaehige PDF oder HTML-Viewer gibt. Naja, wahrscheinlich schon, aber was ist in 50 Jahren?

    Gruss,
    Ludger

    --
    "Wer nicht kaempft hat schon gewonnen."
    1. Hello,

      ich glaube, RTF ist noch nicht out.

      Am dauerhaftesten sind bestimmt alle HR-Formate. Und da gehört HTML ja nun eindeutig dazu und MS-DOC auf keinen Fall.

      Harzliche Grüße aus http://www.annerschbarrich.de

      Tom

      --
      Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
      Nur selber lernen macht schlau
      1. Hallo,

        ich danke allen die mir geholfen haben und sich zu diesem Thema geäußert haben.

        Ich denke ich werde ein kostenloses Tool zum Konvertieren von Doc in PDF verwenden. Ich denke dass es einfacher ist, als HTML/XML und schneller geht. Probleme mit Grafiken oder Tabellen wirds keine geben da die Seiten exakt so übernommen werden wie in Word, auch der Seitenumbruch. Während bei HMTL alles einfach untereinander ist.

        Alles in allem, ist es mit PDFs bequemer und schneller. Vielleicht nicht ganz so zukunftssicher wie mit HTML, aber auch PDF ist ein zukunftssicheres Format.

        Gruß Giovanni

        1. Mach, wie du meinst. Alten Schnösel der du bist.

          1. Laber nicht Alter, sei lieber still!

          2. Schau dir das mal an:
            http://forum.de.selfhtml.org/?t=90482&m=542910

  2. Hi,

    es 100% zukunftssicheres elektronischen Datei-Format gibt es nicht. Zumindest gilt das, wenn Daten ein Mal gespeichert, über Jahrzente nicht angepaßt und dann wieder abgerufen werden sollen... Wenn sich die Computer-Technologie grundlegend ändert, muß man auch immer passende Hardware sichern, bzw. konservieren... Welcher PC kann heute noch 5.25 " Disketten lesen? Mit der physischen Haltbarkeit von CD's oder DVDs siehts sogar noch schlechter aus, wg. der hohen Datendichte/Empfindlichkeit...

    Davon abgesehen meine Meinung:

    • strukturierte Daten => XML
    • reiner Text: => ASCII-TXT
    • Text/Grafik: => PDF

    freundlichen Gruß
    Danny

    --
    Selfcode: fo:) br:& n4:& ie:% mo:) va:| de:] zu:) fl:| ss:) ls:& ls:& js:|
    Motto:    OpenSource - Das Wissen der Menschheit gehört der Welt!
    1. Sorry für die Grammatikfehler, hatte den Satzaufbau mehrmals geändert. ;)
      Eine Ergänzung: Am Besten sind Deine Daten auf einem Online-Server, bzw. bei einem Hoster aufgehoben, wg. regelmäßiger Hardware-Updates, Backup, etc..

      freundlichen Gruß
      Danny

      --
      Selfcode: fo:) br:& n4:& ie:% mo:) va:| de:] zu:) fl:| ss:) ls:& ls:& js:|
      Motto:    OpenSource - Das Wissen der Menschheit gehört der Welt!
      1. Am Besten sind Deine Daten auf einem Online-Server, bzw. bei einem Hoster aufgehoben, wg. regelmäßiger Hardware-Updates, Backup, etc..

        Das meinst Du nicht wirklich ernst, oder?

        Chris

        1. Das meinst Du nicht wirklich ernst, oder?

          Doch, das meine ich. Meine PCs hatten in den letzten fünf Jahren schon zwei Mal Plattencrash mit komplettem Datenverlust und einige der Sicherungs-CD's haben mittlerweile so viele Lesefehler, dass sie nicht mehr zu gebrauchen sind.
          Bei meinem Webhoster (UD-Media) hatte ich noch gar keine Datenverluste und noch besser ist es, die Daten auf mehreren Servern bei zuverlässigen Hostern verteilt zu spiegeln... Dann kann eigentlich nichts mehr passieren.

          1. Ganz so blöd ist die Idee eigentlich auch nicht.
            Wenn ich bedenke, du brauchst dir keine Sorgen um irgendwelche Sicherungs-Medien zu machen. Du musst kein Geld für Band-Laufwerke und Bänder ausgeben, du musst keine Festplattenwechselrahmen mit Festplatten kaufen, auf denen du deine Daten sicherst oder auch keine DVDs.... Und wenn der Provider Mist baut, kannst du ihn verklagen.

            Dennoch, ich persönlich würde es nicht machen. Ich bevorzuge eher Bandlaufwerke oder Wechselplatten. Mal davon abgesehen ist das ja nicht das Problem. Es geht nicht um Medien, sondern um Formate.

    2. Hi,

      » es 100% zukunftssicheres elektronischen Datei-Format gibt es nicht. Zumindest gilt das, wenn Daten ein Mal gespeichert, über Jahrzente nicht angepaßt und dann wieder abgerufen werden sollen... Wenn sich die Computer-Technologie grundlegend ändert, muß man auch immer passende Hardware sichern, bzw. konservieren... Welcher PC kann heute noch 5.25 " Disketten lesen? Mit der physischen Haltbarkeit von CD's oder DVDs siehts sogar noch schlechter aus, wg. der hohen Datendichte/Empfindlichkeit...

      Das ist kein Problem, da ich die Daten beim nächsten Medium-Wechsel (von Diskette auf CD, von CD auf DVD, von DVD auf ...) nicht mehr auf DVDs speichere sondern entweder ein Bandlaufwerk verwende, oder zwei Festplatten. Hätte ich auch schon vor nem Jahr machen sollen - aber im Nachhinein ist man immer schlauer. Dann hab ich nicht mehr das Problem, dass du oben schilderst bzw. kann es sehr leicht lösen.

      Davon abgesehen meine Meinung:

      • strukturierte Daten => XML
      • reiner Text: => ASCII-TXT
      • Text/Grafik: => PDF

      Für mich trifft eben auch formatierter Text mit Grafiken zu. Deswegen favorisiere ich auch PDF.

      Danke, Gruß Giovanni

      1. Hallo.

        • strukturierte Daten => XML
        • reiner Text: => ASCII-TXT
        • Text/Grafik: => PDF
          Für mich trifft eben auch formatierter Text mit Grafiken zu. Deswegen favorisiere ich auch PDF.

        Falls die Daten hinterher nur lesbar sein sollen, ist dies verständlich. Wenn man aber mit den Daten weiterarbeiten möchte, hat (La)TeX/TeXML seine Vorzüge.
        MfG, at

  3. Moin,

    Ich würde XML empfehlen, denn was Du hier schreibst:

    HTML -> ist auch sehr portabel, der Inhalt ist leicht aus der Datei zu lesen (auch ohne Browser), sieht aber nicht auf jedem Bildschirm 100% gleich aus

    ist so allgemein falsch.
    Dass es nicht auf jedem Bildschirm gleich aussieht, ist absolut davon abhängig, wie das XML beschrieben ist. Du kannst durch diverse CSS-Angaben ans Ausgabegerät angepasste Werte liefern. Gerade zur Portierung auf Bildschirme ist X(HT)ML ideal.
    PDF eignet sich höchstens als Druckmedium -- da es aber proprietär ist, auch dort nur bedingt.

    XML hat den Vorteil, dass es durch XSLT leicht neuen Bedürfnissen angepasst werden kann und die grundsätzliche Art von XML wird (Vorsicht, Prophezeihung) noch lange aktuell bleiben.
    Beispiel für eine solide Dokumenthaltung per XML ist OpenOffice/StarOffice. Das dort verwendete Format ist zwar alles andere als perfekt aber das macht ja nichts, denn durch XSLT kann ein bestehendes Dokument schnell seinen Ansprüchen angepasst werden. Und zwar eine XSLT-Datei für alle Dokumente, die anfallen.

    lg, Konrad -

    --
    Der Genitiv ist des Dativs Tod
    1. Hallo Konrad,

      XML hat den Vorteil, dass es durch XSLT leicht neuen Bedürfnissen angepasst werden kann

      Aber wie groß ist der Aufwand dafür? Bei PDFs müsste ich nur die Doc-Datei öffnen und als PDF abspeichern, das warst. Da gibts bestimmt sogar Konvertierungstools, die ganze Verzeichnise konvertieren (kenn jemand eins?).
      Wenn ich für meine DOC, Dateien, die ich als XML abspeichern möchte, erst XSLT Dateien erstellen muss, ist es ein wesentlich größerer Aufwand. Hinzukommt, dass bei ein paar Tausenddateien, es auch Duzende verschiedener Formatierungen gibt. D. h. ich müsste hunderte von Dateien vorher anpassen. Oder, was meinst du zu dem Problem mit der Formatierung?

      Und zwar eine XSLT-Datei für alle Dokumente, die anfallen.

      Wäre dann natürlich schon geil. Man könnte alle Formatierungen  mit einer Datei steuern.

      Gruß Giovanni

      1. Moin,

        Hallo Konrad,

        XML hat den Vorteil, dass es durch XSLT leicht neuen Bedürfnissen angepasst werden kann

        Aber wie groß ist der Aufwand dafür? Bei PDFs müsste ich nur die Doc-Datei öffnen und als PDF abspeichern, das warst. Da gibts bestimmt sogar Konvertierungstools, die ganze Verzeichnise konvertieren (kenn jemand eins?).

        Na ja, für XML gilt das selbe. Die XSLT-Datei musst Du ja nur ein einziges Mal erstellen, dann kannst Du damit tausende von Dokumenten konvertieren. Und ein so großer Aufwand ist auch das erstellen des XSLT nicht.

        Wenn ich für meine DOC, Dateien, die ich als XML abspeichern möchte, erst XSLT Dateien erstellen muss, ist es ein wesentlich größerer Aufwand. Hinzukommt, dass bei ein paar Tausenddateien, es auch Duzende verschiedener Formatierungen gibt. D. h. ich müsste hunderte von Dateien vorher anpassen. Oder, was meinst du zu dem Problem mit der Formatierung?

        Dann hast Du einen Fehler beim Erstellen der Dateien gemacht. OpenOffice handhabt das sowieso um einiges besser als MS Word.
        Nun, wenn Du die Situation hast, bereits bestehende Dokumente zukunftssicher zu machen, dann würde ich doch zu PDF raten.

        Und zwar eine XSLT-Datei für alle Dokumente, die anfallen.
        Wäre dann natürlich schon geil. Man könnte alle Formatierungen  mit einer Datei steuern.

        Ja, das geht aber nur, wenn die Quelldatei XML ist, und das ist bei MS Word nicht wirklich der Fall.
        Die Ausgabedatei muss übrigens *nicht* XML sein ... man kann per XSLT durchaus auch RTF produzieren ...

        lg, Konrad -

        --
        Der Genitiv ist des Dativs Tod
  4. Hi,

    als ich mit EDV begonnen habe, hab ich sehr viele Texte in Winword-Dokumenten gespeichert. Nun, fast 10 Jahre nach der ersten Datei hab ich mir Gedanken um die Zukunftssicherheit gemacht.

    Besser spät als nie ;-)

    Ich denke solch ein spezifisches Format (von der Firma MS in diesem Fall) ist nicht gut, es sollte ein allgemeines Format sein. Wie z. B. PDF, HTML oder TXT.

    Von der allgemeinen Unmöglichkeit einmal abgesehen so ist wirklich keines der vorgeschlagenen Formate für den Zweck längerer "Haltbarkeit" geeignet.

    TXT -> ist wohl die portabelste Lösung, im Klartext in Datei gespeichert, allerdings ohne Formatierung

    Das ist von diesen dreien sogar noch die am wenigsten portable Möglichkeit: gänzlich ohne Angabe zur Funktion Buchstabe<->Bitgruppe kannst Du mit dm Text kaum etwas anfangen. (Text geht noch, da kann man einen Sinn suchen, aber Ziffern könnten völlig falsch sein)

    HTML -> ist auch sehr portabel, der Inhalt ist leicht aus der Datei zu lesen (auch ohne Browser), sieht aber nicht auf jedem Bildschirm 100% gleich aus

    Ist schon etwas portabler, aber einige nötige Angaben sind leider nicht zwingend.

    PDF -> ist auch portabel, der Inhalt wird immer gleich dargestellt

    Hat die gleichen Schwierigkeiten wie TXT und dazu kommt noch eine - nun, nennen wir das mal proprietäre Grammatik in den Spezifikationen. Auch wird es nur dann stets gleich dargestellt, wenn alle Informationen im PDF sind (das trifft vor allem auf Fonts zu!) und stets die gleichen Darstellungsmittel benutzt werden (Gleicher Parser, Monitor, Graphikmaschine usw). Aufgrund einbettbarer Skripte ensteht auch noch ein Sicherheitsrisiko. Außerdem ist es verschlüsselbar, dadurch fällt es fast schon ganz raus.

    Am liebsten wäre mir PDF, ich denke es ist die bessere Wahl wie DOC, RTF oder TXT. Allerdings ist HTML/XML vielleicht doch etwas besser? Was meint ihr? Oder gibt es ein noch zukunftsicherereres Format, auf das man auch noch in 20 Jahren bauen kann? Mir wäre halt besonders wichtig, dass die Daten gute 15 Jahre überdauern können.

    Würde XML empfehlen und TeX für Formatierungszwecke. Gibt's auch beides zusammen. PDF mit komplett eingebetteten Fonts und ohne irgendwelchen Schnickschnack geht auch noch.

    Das allerbeste ist aber immer noch die händische Pflege:
    Regelmäßig nachschauen, ob das gewählte Format noch en vogue ist und schon im Zweifelssfalle zusätzlich in ein moderneres Format kopieren (Nicht nur umwandeln, kopieren! Aber einmal alt+neu reichen, nicht alle behalten ;-). Dadurch wird auch die Grenze der natürlichen Lebensdauer von Computerformaten überschritten.
    Diesen Pflegevorgang sollte man etwa alle 5 Jahre durchführen. Das ist auch ganz nützlich für die Datenhaltung an und für sich, die modernen Medien halten ja leider nicht so lange, wie versprochen.

    so short

    Christoph Zurnieden

    1. Hallo Christoph,

      danke dir erst mal für die ausführliche Antwort.

      Würde XML empfehlen und TeX für Formatierungszwecke.

      Das hat mir auch schon ein anderer empfohlen, aber ich sehe das Problem, des Aufwands. PDFs könnt ich nur öffnen und im richtigen Format abspeichern. Ich glaube nicht dass das so einfach mit XMl und TeX geht, oder?

      Gibt's auch beides zusammen. PDF mit komplett eingebetteten
      Fonts und ohne irgendwelchen Schnickschnack geht auch noch.

      Wo kann ich mir genauerere Spezifikationen finden, um zu wiessen wie "allgemein" ich meine PDF aufbauen muss, damit diese möglichst portabel ist und möglichst unabhängig an irgendwelche Systeme.

      Gruß Giovanni

      1. Moin,

        Würde XML empfehlen und TeX für Formatierungszwecke.
        Das hat mir auch schon ein anderer empfohlen, aber ich sehe das Problem, des Aufwands. PDFs könnt ich nur öffnen und im richtigen Format abspeichern. Ich glaube nicht dass das so einfach mit XMl und TeX geht, oder?

        Das kommt immer darauf an, wieviel Du bereit bis zu zahlen. Für viele Formate gibt es bereits Konvertierungssoftware, wenige davon ist allerdings kostenlos.
        Für besondere Konversions-Jobs muss man im Extremfall eben einen Programmierer anstellen, der einem ein spezielles Tool schreibt. Geht alles, kostet nur.

        lg, Konrad -

        --
        Der Genitiv ist des Dativs Tod
        1. Hi,

          Würde XML empfehlen und TeX für Formatierungszwecke.
          Das hat mir auch schon ein anderer empfohlen, aber ich sehe das Problem, des Aufwands. PDFs könnt ich nur öffnen und im richtigen Format abspeichern. Ich glaube nicht dass das so einfach mit XMl und TeX geht, oder?

          Das kommt immer darauf an, wieviel Du bereit bis zu zahlen. Für viele Formate gibt es bereits Konvertierungssoftware, wenige davon ist allerdings kostenlos.

          Eher das Gegenteil ist der Fall, für die meisten Formate, auch die Proprietären gibt es freie Umwandlungsprogramme.

          Von TeX aus und kaum weniger von LaTeX bekommt man eigentlich alle gängigen Formate, Postscript und PDF geht sogar direkt. Wenn Du Dich bei XML an ein (heute) gängiges Format hältst, kannst Du auch in alles mögliche umwandeln.
          Wahrcheinlich sogar in mehr, als von TeX aus ;-)

          Für besondere Konversions-Jobs muss man im Extremfall eben einen Programmierer anstellen, der einem ein spezielles Tool schreibt. Geht alles, kostet nur.

          Geht alles, kostet so gut wie nix. Bei den ganzen freien Konvertierungsprgrammen kann man sogar versuchen den Programmierer zu überreden. Im Gegenzug vielleicht das README übersetzen oder ein wenig Dokumentation hinzufügen o.ä. Auch mit kleinen Dingen kann man Freude bereiten.

          Die beiden Fälle in denen man um einen Programmierer wirklich nicht herumkommt und damit auch um die Bezahlung sind entweder völlig obskure Formate oder wenn's gestern fertig gewesen sein soll.

          Ich habe über die Frage des Informationerhaltes - und dazu gehört ja auch das Datenformat - schon lange nachgedacht. Meine Empfehlung ist natürlich diskutabel, aber nicht mit _so_ billigen Argumenten angreifbar ;-)
          Aber ein Angriff ist natürlich trotzdem erwünscht, so ist das nicht!

          so short

          Christoph Zurnieden

          1. Hallo,

            also ich hab mal versucht ne DOC-Datei unter Word als XML zu speichern, was dabei rausgekommen ist ist irgendwie komisch. Da einen Text - mit dem Auge auszulesen - ist unmöglich. Zu viel Tags überall.
            Hinzukommt dass die Datei statt 139 KB als Word-Dokument über 600 als XML Datei groß ist (also mehr als 4x so groß).

            Wenn ich nun doch XML verwenden würde, wäre das was da MS Word macht okay, oder gibts da bessere Konvertierungstools?

            Gruß Giovanni

            1. Moin

              Wenn ich nun doch XML verwenden würde, wäre das was da MS Word macht okay, oder gibts da bessere Konvertierungstools?

              "Was Word da mach" ist halt für Word wieder genau so lesbar wie eine doc-Datei. XML ist ja kein festes Format, sondern nur ein Standard, in dem beliebige Formate definiert werden können.

              Wenn du nur den Text haben willst, kannst du alle Tags rausschmeißen, kein Problem. Nur Word wird es dann halt nicht mehr anzeigen können.

              Tschö,
              dbenzhuser

              1. Also brauch ich dann ne XSLT-Datei  mit der Formatierung, damit ich diese nicht verliere. Mit welchem Programm könnt ich denn sowas machen? Hab kein Bock das per Hand zu machen, ist viel zu viel Arbeit (sind schließlich nicht nur 10 oder 20 Dateien sondern ein paar Tausend!).

                1. Moin,

                  Also brauch ich dann ne XSLT-Datei  mit der Formatierung, damit ich diese nicht verliere. Mit welchem Programm könnt ich denn sowas machen? Hab kein Bock das per Hand zu machen, ist viel zu viel Arbeit (sind schließlich nicht nur 10 oder 20 Dateien sondern ein paar Tausend!).

                  Na und? Es gibt Drag-And-Drop-Technologie. Schreibe Dir einfach ein NT-Batch, das den Transformer mit dem entsprechenden XSLT und der Eingabedatei aufruft, das ist eine Zeile. Dann selektiere all Deine XML-Dateien und dragge sie auf dieses Batch.

                  lg, Konrad -

                  --
                  Der Genitiv ist des Dativs Tod
            2. Hi,

              Wenn ich nun doch XML verwenden würde, wäre das was da MS Word macht okay, oder gibts da bessere Konvertierungstools?

              Ja, auf jeden Fall ;-)
              Openoffice wäre da wohl ideal, da es sich auch mit kripten steuern läßt und das ist wohl genau das, was Du brauchst, oder?

              Direkt etwas Fertiges habe ich aber leider nicht gefunden, einfach mal selber suchen. Da Deine Problem aber in ähnlicher Form auch andere gehabt haben sollten, dürfte wohl auch etwas zu finden sein.

              http://www.ooodocs.org/
              http://www.ooomacros.org/

              Vorsicht, französisch! ;-)
              http://macadam.sourceforge.net/
              http://www.lodel.org

              Weiß nicht so recht, einfach mal reinschauen
              http://sourceforge.net/projects/servoo/
              http://ooextras.sourceforge.net/
              http://phpdocwriter.sourceforge.net/

              API zum Selberbasteln
              http://wonderlogic.com/tiki/tiki-index.php?page=JooTemplates

              Hier sind auch noch ein paar Links:
              http://freshmeat.net/search/?q=openoffice

              so short

              Christoph Zurnieden

          2. Moin,

            Für besondere Konversions-Jobs muss man im Extremfall eben einen Programmierer anstellen, der einem ein spezielles Tool schreibt. Geht alles, kostet nur.

            Geht alles, kostet so gut wie nix. Bei den ganzen freien Konvertierungsprgrammen kann man sogar versuchen den Programmierer zu überreden.

            ... und wer sich als Programmierer auf so etwas einlässt, ruiniert den ohnehin schon gebeutelten Markt.

            lg, Konrad -

            --
            Der Genitiv ist des Dativs Tod
            1. Hi,

              Geht alles, kostet so gut wie nix. Bei den ganzen freien Konvertierungsprgrammen kann man sogar versuchen den Programmierer zu überreden.

              ... und wer sich als Programmierer auf so etwas einlässt, ruiniert den ohnehin schon gebeutelten Markt.

              Was für einen Markt? Der Dot-Com Boom ist schon lange tot. Kommerzielle Programme gehen so langsam den Bach runter. (Ausgenommen Spiele, aber dafür sind nur sehr wenige Programmierer nötig)
              Nein, das große Spielfeld ist die Inhouse Programmierung. Die zwei Zeilen Shellscript hier, die 10 Zeilen SQL da und das eine oder andere Perlskript, Frontend usw.
              Oder wie hier gerade auftaucht: das Problem zu lösen einen ganzen Hintern voll MS-Word Dateien haltbar machen zu müssen.

              Und wenn man dem Bewerbungsbogen schon ein paar beliebte Programme beifügen kann ist das bestimmt nicht verkehrt. Ist dabei die Entwicklung öffentlich gewesen kann ich als Personalchef auch gut kontrollieren, wie auf Anfragen reagiert wird, es mit der Teamfähigkeit bestellt ist, ob sauber gearbeitet wird usw.

              Und nochmal ganz explizit:
              Wenn Du Geld für etwas haben möchtest was ein anderer umsonst macht, hast Du keinerlei Anspruch darauf, das der andere diese Unverschämtheit läßt.

              so short

              Christoph Zurnieden

    2. Hallo,

      PDF -> ist auch portabel, der Inhalt wird immer gleich dargestellt

      (...) Aufgrund einbettbarer Skripte ensteht auch noch ein Sicherheitsrisiko. Außerdem ist es verschlüsselbar, dadurch fällt es fast schon ganz raus.

      Wieso fällt es deshalb heraus? Es ging darum, wie man am besten seine Daten speichern kann. Da kann Verschlüsselung nur von Vorteil und also ein Feature des Formats sein, wenn man es *braucht*. Wenn man es *nicht* braucht – und ich sehe gerade kein Grund, wieso man die Nutzungsmöglichkeiten von Daten, die man für 15 Jahre speichern will, dermaßen einschränken sollte, denn hier war ja gerade die langfristige uneingeschränkte Verarbeitbarkeit das Kriterium – lässt man es einfach, dann kann es gar kein Problem sein und bringt auch keine Nachteile.

      Mathias

      1. Hi,

        Auha, jetzt hat's mir den Konqueror zerlegt, jetzt darf ich alles nochmal. Aber ist meist gut für die Kürze ;-)

        PDF -> ist auch portabel, der Inhalt wird immer gleich dargestellt

        (...) Aufgrund einbettbarer Skripte ensteht auch noch ein Sicherheitsrisiko. Außerdem ist es verschlüsselbar, dadurch fällt es fast schon ganz raus.

        Wieso fällt es deshalb heraus?

        Es ist stets der letzte Tropfen, der das Faß zum Überlaufen bringt, so auch hier.

        Es ging darum, wie man am besten seine Daten speichern kann. Da kann Verschlüsselung nur von Vorteil und also ein Feature des Formats sein, wenn man es *braucht*. Wenn man es *nicht* braucht ? und ich sehe gerade kein Grund, wieso man die Nutzungsmöglichkeiten von Daten, die man für 15 Jahre speichern will, dermaßen einschränken sollte, denn hier war ja gerade die langfristige uneingeschränkte Verarbeitbarkeit das Kriterium ? lässt man es einfach, dann kann es gar kein Problem sein und bringt auch keine Nachteile.

        Es ist tatsächlich ein Problem, wenn auch nur für die Bedingung: lange Haltbarkeit.
        Wenn ein Feature da ist und Du es nicht ausschalten kannst, dann ist die Wahrscheinlichkeit, das das irgendjemand trotzdem benutzt, und sei es aus Versehen, recht hoch. Um dann im Falle von Verschlüsselung an Deine Daten zu kommen brauchst Du ein Paßwort (Ich gehe einfach mal davon aus, das die Verschlüsselung auch tatsächlich funktioniert). Das kann schwierig werden. Im Falle der Haltbarkeit von Information ist das also ein Risiko, das sich nicht durch simple Datenredundanz beheben läßt.

        so short

        Christoph Zurnieden

        1. Hallo.

          Wenn ein Feature da ist und Du es nicht ausschalten kannst, dann ist die Wahrscheinlichkeit, das das irgendjemand trotzdem benutzt, und sei es aus Versehen, recht hoch.

          Ja, gerade eben habe ich versehentlich <marquee> verwendet. Es ist doch schlimm, dass ich in HTML jedes Wort in spitze Klammern stecken kann, und bei manchen Wörtern geschehen dann Dinge, die ich gar nicht bezweckt habe.
          MfG, at

          1. Hallo,

            Wenn ein Feature da ist und Du es nicht ausschalten kannst, dann ist die Wahrscheinlichkeit, das das irgendjemand trotzdem benutzt, und sei es aus Versehen, recht hoch.

            Ja, gerade eben habe ich versehentlich <marquee> verwendet. Es ist doch schlimm, dass ich in HTML jedes Wort in spitze Klammern stecken kann, und bei manchen Wörtern geschehen dann Dinge, die ich gar nicht bezweckt habe.

            Ja, tragisch, nicht? Ich habe jetzt auch alle Messer aus der Küche entfernt, weil die Wahrscheinlichkeit, dass ich mich aus Versehen damit absteche, zu hoch ist. Wahrlich, Messer sind für die Küchenarbeit völlig ungeeignet, allein schon die Denkbarkeit...

            Mathias

            1. Hi,

              Ja, tragisch, nicht? Ich habe jetzt auch alle Messer aus der Küche entfernt, weil die Wahrscheinlichkeit, dass ich mich aus Versehen damit absteche, zu hoch ist. Wahrlich, Messer sind für die Küchenarbeit völlig ungeeignet, allein schon die Denkbarkeit...

              Das ist aber nicht sehr konsequent.
              Die Luft, die Du atmest, könnte Giftgas enthalten.
              Die Luft ist also für die Atmung völlig ungeeignet, allein schon die Denkbarkeit ...
              Stelle also vorsorglich die Atmung ein!

              ;-)

              cu,
              Andreas

              --
              MudGuard? Siehe http://www.Mud-Guard.de/
              Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
  5. Ich denke solch ein spezifisches Format (von der Firma MS in diesem Fall) ist nicht gut, es sollte ein allgemeines Format sein. Wie z. B. PDF, HTML oder TXT.

    Gegen PDF spricht dasselbe wie gegen MS-Formate: Es ist firmenspezifisch, Adobe in diesem Fall.

    LATEX halte ich in seiner jetzigen Form auch für überholt: Eine moderene Textverarbeitung sollte auf Unicode basieren und sich zur Darstellung von Zeichen nicht irgendwelcher Krücken bedienen müssen.

    Und ein Layout lässt sich mit XML und CSS genauso gut beschreiben. (Dass es an Prgrammen mangelt, die sämtliche CSS-Angaben auch umsetzen, ist was anderes.)

    Wenn es um reinen Text geht, ist text/plain sicher auch in Zukunft ein lesbares Format. Wenn Datenstrukturen beschrieben werden sollen, wird XML in absehbarer Zukunft nicht aussterben, eben weil es Klartext ist und firmenunabhängig.

    Gunnar

    --
    "Nobody wins unless everybody wins." (Bruce Springsteen)
    1. Hi,

      Ich denke solch ein spezifisches Format (von der Firma MS in diesem Fall) ist nicht gut, es sollte ein allgemeines Format sein. Wie z. B. PDF, HTML oder TXT.

      Gegen PDF spricht dasselbe wie gegen MS-Formate: Es ist firmenspezifisch, Adobe in diesem Fall.

      Gegen PDF spricht nicht das Gleiche, wie gegen MS-Formate, die Spezifikation ist offen.

      Es hat bei mir trotzdem nur mit hauchdünnem Vorsprung gewonnen, da es nur das kleinste Übel ist. Auch wenn die Spezifikation in einigen wichtigen Details auffällig unklar ist, das Problem mit fehlendenFonts besteht (muß alles eingebaut werden und kann dadurch urheberrechtlichen Ärger geben), 'ne Menge Patente beteiligt sind usw.

      LATEX halte ich in seiner jetzigen Form auch für überholt: Eine moderene Textverarbeitung

      TeX ist keine Textverarbeitung sondern ein Satzprogramm!

      sollte auf Unicode basieren

      Warum?

      und sich zur Darstellung von Zeichen nicht irgendwelcher Krücken bedienen müssen.

      Auch Fonts sind nur Krücken.

      Und ein Layout lässt sich mit XML und CSS genauso gut beschreiben. (Dass es an Prgrammen mangelt, die sämtliche CSS-Angaben auch umsetzen, ist was anderes.)

      Wie Du schon so richtig festellst: das ist leider erst nur reine Theorie udn solange es das ist, fällt es für diesen Zweck leider durch den Rost und es muß etwas andere her, in diesem Fall TeX.

      Wenn es um reinen Text geht, ist text/plain sicher auch in Zukunft ein lesbares Format. Wenn Datenstrukturen beschrieben werden sollen, wird XML in absehbarer Zukunft nicht aussterben, eben weil es Klartext ist und firmenunabhängig.

      text/plain ist zwar ein relativ sicheres Format, wenn es in 7 Bit ASCII codiert ist, abe das war's dann auch schon. Um mehr Buchstaben zu bekommen müßte dann sowas wie z.B. Base64 her o.ä. also eine weitere Codierung. Dann dürfte es in 50 Jahren auch noch ASCII Tabellen geben,klar, nur woran ist zu erkennen, das der Text in ASCII codiert wurde?

      Bei XML dagegen ist die Default-Codierung vorgeschrieben und Endianess ist auch kein Problem.

      so short

      Christoph Zurnieden

      1. Moin,

        Und ein Layout lässt sich mit XML und CSS genauso gut beschreiben. (Dass es an Prgrammen mangelt, die sämtliche CSS-Angaben auch umsetzen, ist was anderes.)

        Wie Du schon so richtig festellst: das ist leider erst nur reine Theorie udn solange es das ist, fällt es für diesen Zweck leider durch den Rost und es muß etwas andere her, in diesem Fall TeX.

        Man kann ja zur Ausgabe ein XSLT verwenden, das nach TeX transformiert ...

        text/plain ist zwar ein relativ sicheres Format, wenn es in 7 Bit ASCII codiert ist, abe das war's dann auch schon.

        Ach was. ANSI macht vielleicht Probleme, da das ein Windows-only-Standard ist aber Unicode ist dank BOM keinerlei Problem.

        lg, Konrad -

        --
        Der Genitiv ist des Dativs Tod
        1. Hi,

          Wie Du schon so richtig festellst: das ist leider erst nur reine Theorie udn solange es das ist, fällt es für diesen Zweck leider durch den Rost und es muß etwas andere her, in diesem Fall TeX.

          Man kann ja zur Ausgabe ein XSLT verwenden, das nach TeX transformiert ...

          Autsch! ;-)

          text/plain ist zwar ein relativ sicheres Format, wenn es in 7 Bit ASCII codiert ist, abe das war's dann auch schon.

          Ach was. ANSI macht vielleicht Probleme, da das ein Windows-only-Standard ist aber Unicode ist dank BOM keinerlei Problem.

          Mit BOM ist es kein text/plain mehr sondern markiert!

          Es gibt auch noch viel mehr Codierungen als nur ASCII, ANSI, EBDIC usw. Die gibt es alle nicht mehr? Tja, da sind wir genau bei dem Punkt: lange Haltbarkeit. Woher weißt Du, das ASCII auch in 50 Jahren noch benutzt wird? Und die oben angesprochenen obskuren Codierungen sind noch gar nicht so lange tot!

          so short

          Christoph Zurnieden

  6. Tachauch

    Wichtig ist vor allem, das das Format gut Dokumentiert ist.
    Für eine reine TXT-Datei benötigt man zum dekodieren lediglich eine ASCII-Tabelle, die sollte sich auch in 50 Jahren noch auftreiben lassen.
    Unicode ist da auch nicht bedeutend schwerer.

    DOC scheidet aus, PDFs "von Hand" auszulesen macht sicher auch keinen Spaß.
    OpenOffice-Dokumente sind besser, aber die muss man auch erst einmal noch entpacken.

    Formate wie XML oder HTML, die im grunde nur erweiterte Textdateien sind machen die wenigsten Probleme, solange es nur um die enthaltene Information und nicht ums Layout geht. Eine XML-Datei mit ausführlichen beschreibenden Elementnamen sollte kein Problem sein.

    TeX ist mir nicht so lieb, da basiert zu viel auf recht willkürlich festgelegten Formatierungen.

    Wirklich beständig ist aber eben doch nur eine gut gelagerte Schiefertafel (mit universell verständlicher Erklärung der einzelnen Schriftzeichen und Wörter...).
    Wenn ich mal Zeit habe werden ich den Archeologen in tausend Jahren eine Freude machen und mal ein paar vergraben :)

    Tschö,
    dbenzhuser

  7. Hallo,

    Am liebsten wäre mir PDF, ich denke es ist die bessere Wahl wie DOC, RTF oder TXT.

    *lol*

    Im ernst: stelle dir folgende Frage: was passiert wenn die Datei in deinem gewählen Format beschädigt wird?

    DOC, RTF, PDF: du hast im Grunde alles verloren, denn es genügt oft ein eiziges fehlerhafte Byte um deine Datei unbrauchbar zu machen.

    Jetzt stelle dir die Frage: welches Format könnte es ermöglichen, dass du sowohl den Inhalt in der Datei hast, als auch eine Sematik für den Inhalt (d.h. eine Sematik für verschiedene Inhaltsteile) und zwar so, dass diese von einer Darstellung unabhängig sind und auch im Falle einer Beschädigung der Datei noch wiederhergestellt werden können?

    HTML schiedt aus, weil es nicht darstellungsunabhängig ist.

    Was bleibt ist: XML.

    »»Oder gibt es ein noch zukunftsicherereres Format, auf das man auch noch in 20 Jahren bauen kann? Mir wäre halt besonders wichtig, dass die Daten gute 15 Jahre überdauern können.

    Es gibt keine wirkliche zukunftssichere Formate (z.B. es wird dem TIFF format etwa 50 Jahre nachgesagt), also sind alle Lösungen immer nur kurzzeitig verwendbar, da es auch immer etwas geben muss, was mit dem Format umgehen kann (ein Rechner, ein Programm). Die Tradierung von Infotmationen ist eine echte Herausforderung.
    Aber XML hat sehr gute Chancen, dass es länger als 20 Jahre verwendet werden kann und vor allem: eine vernünftige XML-Datei ist selbstbeschreibend, d.h. man kann aus der Datei selbst die Regel für die Datei ableiten und so ggf. auch fehlerhafte Bereiche korrigieren.

    Grüße
    Thomas

    1. Ehrlich, ich hab alle Vorteile von XML verstanden, klar, XML ist das beste, bestreite ich doch nicht. Habe ich auch den ganzen Tag lang NIE gemacht. ABER ich hab ein paar Tausend Dateien, mit welchem Tool kann ich denn die DOC-Dateien so abspeichern dass meine Formatierung, meine Grafiken und meine Tabellen erhalten bleiben?

      Bei PDF dauert das ganze Pro Datei vielleicht 30 Sekunden. Öffnen, neu Speichern, fertig. Ich bin gerne für jeden Vorschlag offen, deswegen bin ich auch hier. Weil die meisten die hier antworten ja auch mehr Ahnung hab als ich. Aber, es reden alle darüber wie toll XML ist, nur wie bitte soll ich das ganze umsetzen?

      Gruß Giovanni

      1. Sorry, für den falschen Namen, der Artikel war nicht von Thomas J.k., sondern von mir.

      2. Hallo Giovanni oder Thomas oder wie auch immer,

        Ehrlich, ich hab alle Vorteile von XML verstanden, klar, XML ist das beste, bestreite ich doch nicht. Habe ich auch den ganzen Tag lang NIE gemacht. ABER ich hab ein paar Tausend Dateien, mit welchem Tool kann ich denn die DOC-Dateien so abspeichern dass meine Formatierung, meine Grafiken und meine Tabellen erhalten bleiben?

        Dazu gibt es keinen Tool.
        Word ist Word und so sehr proprietär, dass sogar die einzelenen Versionen untereinander inkompatibel sind. (und das word2003 xml hat mit xml ziemlich wenig zu tun.)

        Bei PDF dauert das ganze Pro Datei vielleicht 30 Sekunden. Öffnen, neu Speichern, fertig. Ich bin gerne für jeden Vorschlag offen, deswegen bin ich auch hier. Weil die meisten die hier antworten ja auch mehr Ahnung hab als ich. Aber, es reden alle darüber wie toll XML ist, nur wie bitte soll ich das ganze umsetzen?

        Wenn es für dich privat ist, solltest du einfach bei RTF oder PDF bleiben. Oder auch bei *.doc, da muss du halt dafür sorgen, dass die Dateien immer wieder in die aktuelle .doc-Format konvertiert werden, oder das dein PDF-Generator dein .doc-Format richtig konvertiert in welöche PDF-Verion auch immer.
        Oder du nimmst OpenOffice und machst du damit etwas (diese speichert seine Dateien bereits in XML).

        Wenn es nicht privat ist: das kann man hier und jetzt nicht wirklich behandeln.
        Da sind dann die Fragen: will man _wirklich_ auf ein sichereres Format umsteigen (oder man denkt nur es zu wollen) und wenn ja, welche Ressourcen (d.h. nicht _nur_ Geld) beabsichtigt/kann/will man dafür bereitstellen. Dann erst kann man über alles andere diskutieren. Es gibt viele Tools für word2xml (--> Sichtwort für Goolge) Konvertierung manche gut, manche weniger gut. Und so weiter.

        Grüße
        Thomas

    2. Hi,

      Im ernst: stelle dir folgende Frage: was passiert wenn die Datei in deinem gewählen Format beschädigt wird?

      DOC, RTF, PDF: du hast im Grunde alles verloren, denn es genügt oft ein eiziges fehlerhafte Byte um deine Datei unbrauchbar zu machen.

      kann man die PDFs nicht debuggen?

      Es gibt keine wirkliche zukunftssichere Formate

      ASCII sollte immer in den Geschichtsbuechern hinreichend dokumentiert bleiben.

      Aber XML hat sehr gute Chancen, dass es länger als 20 Jahre verwendet werden kann und vor allem: eine vernünftige XML-Datei ist selbstbeschreibend, d.h. man kann aus der Datei selbst die Regel für die Datei ableiten und so ggf. auch fehlerhafte Bereiche korrigieren.

      XML ist eben mehr als eine Sprache!

      Gruss,
      Ludger

      --
      "Wer nicht kaempft, hat schon gewonnen."
      1. Hallo,

        DOC, RTF, PDF: du hast im Grunde alles verloren, denn es genügt oft ein eiziges fehlerhafte Byte um deine Datei unbrauchbar zu machen.

        kann man die PDFs nicht debuggen?

        Nein. (AFAIK)

        Es gibt keine wirkliche zukunftssichere Formate

        ASCII sollte immer in den Geschichtsbuechern hinreichend dokumentiert bleiben.

        sollte !=  es wird.

        XML ist eben mehr als eine Sprache!

        Sage ich auch.

        Grüße
        Thomas

  8. Hi GiovanniRena,

    Du hast uns eigentlich zu wenig über die Dokumente gesagt, um wirklich Auskunft geben zu können. Ich mag PDF-Dateien nicht als Sicherungsmedium, weil sie bei Fehlern tatsächlich schwerer wieder zu rekonstruieren sind als viele andere Formate.

    TXT -> ist wohl die portabelste Lösung, im Klartext in Datei gespeichert, allerdings ohne Formatierung

    Dann sag uns doch mal, um welche Art von Dokumenten es sich handelt, warum Du sie speichern willst, welche Rolle dabei Formate und Schriften spielen.

    Am liebsten wäre mir PDF, ich denke es ist die bessere Wahl wie DOC, RTF oder TXT. Allerdings ist HTML/XML vielleicht doch etwas besser? Was meint ihr? Oder gibt es ein noch zukunftsicherereres Format, auf das man auch noch in 20 Jahren bauen kann? Mir wäre halt besonders wichtig, dass die Daten gute 15 Jahre überdauern können.

    Natürlich sind jetzt alle sauer, aber das Word-Format gehört, was Lebensdauer angeht, zu den langlebigsten komplexen Formaten im Netz. Meine Word-Version kann sogar noch Word 2.0 schreiben und alle alten Word-Formate lesen und sauber konvertieren. Ich hab's gerade nochmal ausprobiert. Allerdings war das Älteste, was ich finden konnte, Word 5.0 Dateien.

    Zumindest solltest Du mit einem Makro alle *.doc aufrufen und in dem neuesten Word-Format speichern können, wenn Du das willst. Zudem ist es Unfug, dass Word-Dateien völlig unzugänglich werden, wenn ein Byte manipuliert wird, das gehört ins Reich der Sage. Das kriegt man lockerer wieder hin als bei vielen anderen Formaten.

    Viele Grüße
    Mathias Bigge