Andreas-Lindig: Dateiformate für Text

Hallo zusammen,
Ich kann in meinem Textprogramm verschiedene Dateiformate und Zeichensätze zum Abspeichern verwenden.
Besonders, weil ich öfter zwischen Mac und PC austauschen muß, und da Probleme habe, interessieren mich mal Einzelheiten hierzu.
kann mir jemand die folgenden Möglichkeiten erklären?

Formate (klingen selbsterklärend, aber was macht den Unterschied aus):
1. Mac
2. PC
3. Unix

Zeichensätze
1. Standard
2. Ansi
3. Dos
4. Unicode
5. Unicode (big endian)
6. UTF-8
dankeschön und Gruß, Andreas

  1. Moin!

    Formate (klingen selbsterklärend, aber was macht den Unterschied aus):

    1. Mac
    2. PC
    3. Unix

    Der Unterschied hier ist das Zeilenende-Zeichen. DOS (Unix läuft auch auf PC) verwendet CRLF, Unix nur LF, und Mac nur CR. (Oder irgendwie so - DOS ist sicher). Wenn du eine DOS-Datei unter Unix in einem Editor öffnest, hast du vor jedem Zeilenende noch ein nicht darstellbares Sonderzeichen stehen, welches unter Umständen stört.

    Allerdings: Wenn du mit FTP im ASCII-Modus hochlädst, wird das Zeilenende automatisch angepaßt auf das jeweilige System. Du kannst diesem Problem also entgehen, ohne explizit für das System abzuspeichern. Perl-Dateien z.B. funktionieren auf Unix-Servern nicht, wenn sie DOS-Zeilenenden haben.

    Zeichensätze

    1. Standard
    2. Ansi
    3. Dos
    4. Unicode
    5. Unicode (big endian)
    6. UTF-8

    Der Zeichensatz definiert im Grunde, welche Sonderzeichen mit welchen Hexadezimalcodes verknüpft sind. Die ersten 127 Zeichen (Hex 00 bis 7F) sind überall identisch, das sind die Zahlen und die Buchstaben a-z und A-Z. Sonderzeichen wie äöüßÄÖÜ, oder auch Zeichen anderer Sprachen (kyrillisch, griechisch, arabisch, japanisch, chinesisch) sind dort nicht definiert. Für Fremdsprachen ist Unicode und UTF-8 gut, für deutsche Sonderzeichen reicht es, wenn sich beide Seiten auf einen Zeichensatz verständigen können. DOS, ANSI und Standard sind in diesem Zusammenhang nicht unbedingt aussagekräftig, da es vom verwendeten Zeichensatz abhängt, welche Sonderzeichen existieren und wo sie sich befinden.

    Im Zweifel solltest du mal probieren, was bei der Übertragung zwischen den Systemen so passiert - mehr als daß die Umlaute verloren gehen kann nicht passieren. :)

    - Sven Rautenberg

    1. Hi,

      Allerdings: Wenn du mit FTP im ASCII-Modus hochlädst, wird das Zeilenende automatisch angepaßt auf das jeweilige System.

      das ist schonmal beruhigend...

      mehr als daß die Umlaute verloren gehen kann nicht passieren.

      das finde ich schlimm genug!

      dankeschön und Gruß, Andreas

      http://www.andeas-lindig.de/was_ist_das_extra.htm

      1. Hi,

        mehr als daß die Umlaute verloren gehen kann nicht passieren.
        das finde ich schlimm genug!

        dann solltest Du vielleicht auf ein plattformunabhängiges Dateiformat
        umsteigen - beispielsweise unter Verwendung von HTML-Entities.

        Viele Grüße
              Michael

        1. Hi,

          dann solltest Du vielleicht auf ein plattformunabhängiges Dateiformat
          umsteigen - beispielsweise unter Verwendung von HTML-Entities.

          hmmm... meinst Du diese php-funktion? Ich soll also meine Dateien mit php nochmal auslesen und neu schreiben...

          <am kopf kratz>
             kannst Du das etwas genauer erklären?
          </am kopf kratz>

          dankeschön und Gruß, Andreas