shev: Umlaute und XML Dateien

Hi,

Wenn ich normalen Text in deutschar Sprache, so wie
<x>
  Herzliche Grüsse
</x>

in einer XML Datei speichern will - wie geht dies möglichst
einfach?

Soweit mir bekannt geht das nur wenn man die ö ü ä durch
Entities ersetzt - das will ich allerdings nicht machen aus
mehreren Gründen, vor allem aber eigentlich da ich die
original Information so behalten möchte, wie ich sie
eintippe
(wenn es keine andere Methode gibt nutze ich eine andere
Datei und erstelle die XML Einträge dynamisch.)

Wollte nachfragen

Grüsse,
shev

  1. LOL.
    Ich wollte
    "deutscher Sprache" schreiben.... "deutschar" klingt seltsam. ;)
    Schade das man hier nicht editieren kann!

  2. Moin,

    Hi,

    Wenn ich normalen Text in deutschar Sprache, so wie
    <x>
      Herzliche Grüsse
    </x>

    in einer XML Datei speichern will - wie geht dies möglichst
    einfach?

    Soweit mir bekannt geht das nur wenn man die ö ü ä durch
    Entities ersetzt - das will ich allerdings nicht machen

    benutz einfach UTF-8 als Encoding (was in XML ohnehin Standard ist) und deine Sorgen sind dahin :) Das einzige, was man dann noch maskieren muss, sind die paar Zeichen, die in XML eine besondere Bedeutung haben, bspw. spitze Klammern. Falls du mit PHP arbeitest, ist htmlspecialchars() sinnvoll.

    Tschau,
    Martin

    1. Hallo,

      benutz einfach UTF-8 als Encoding (was in XML ohnehin Standard ist) und deine Sorgen sind dahin :) Das einzige, was man dann noch maskieren muss, sind die paar Zeichen, die in XML eine besondere Bedeutung haben, bspw. spitze Klammern. Falls du mit PHP arbeitest, ist htmlspecialchars() sinnvoll.

      Wenn ich mich nicht irre, kann er das XML-Sonderzeichenproblem auch einfach durch eine CDATA-Section umgehen, in die er einfach alle Inhalte reinpackt?

      Gruß
      LeKuchen

  3. Hallo,

    Wenn ich normalen Text in deutschar Sprache, so wie
    <x>
      Herzliche Grüsse
    </x>

    in einer XML Datei speichern will - wie geht dies möglichst
    einfach?

    Verwende die XML-Deklaration:
    <?xml version="1.0" encoding="iso-8859-1"?>

    http://de.selfhtml.org/xml/regeln/xmldeklaration.htm

    Grüße
    Thomas

    1. Moin,

      Verwende die XML-Deklaration:
      <?xml version="1.0" encoding="iso-8859-1"?>

      http://de.selfhtml.org/xml/regeln/xmldeklaration.htm

      weshalb kein UTF-8?

      Tschau,
      Martin

      1. Hi, danke! Es geht tatsächlich einfach, mit
        <?xml version="1.0" encoding="iso-8859-1"?>

        Habe UTF-8 ausprobiert, allerdings hatte ich statt
        Grüsse
        auf einmal
        GR[]sse

        Das [] soll einen kleinen schwarzen Block darstellen)
        Eventuell liegt das an meinem Editor, auf alle Fälle funktioniert
        das tadellos mit encoding="iso-8859-1", und das is eigentlich
        was ich brauchte. Daher, Problem gelöst, vielen Dank!

        1. Hello out there!

          Eventuell liegt das an meinem Editor, auf alle Fälle funktioniert
          das tadellos mit encoding="iso-8859-1"

          Du musst die Codierung angeben, mit der du das Dokument im Editor auch abspeicherst. Oder andersrum: das Dokument so abspeichern, wie du es angibst.

          See ya up the road,
          Gunnar

          PS: Warum nicht Grü_ß_e?

          --
          “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
        2. Moin,

          Hi, danke! Es geht tatsächlich einfach, mit
          <?xml version="1.0" encoding="iso-8859-1"?>

          Habe UTF-8 ausprobiert, allerdings hatte ich statt
          Grüsse
          auf einmal
          GR[]sse

          Das [] soll einen kleinen schwarzen Block darstellen)
          Eventuell liegt das an meinem Editor, auf alle Fälle funktioniert
          das tadellos mit encoding="iso-8859-1", und das is eigentlich
          was ich brauchte. Daher, Problem gelöst, vielen Dank!

          Ich kann Notepad++ (http://notepad-plus.sourceforge.net/de/site.htm) sehr empfehlen. Nicht nur wegen UTF-8 (was übrigens auch mit Notepad geht).

          Tschau,
          Martin

      2. Hallo,

        Verwende die XML-Deklaration:
        <?xml version="1.0" encoding="iso-8859-1"?>

        http://de.selfhtml.org/xml/regeln/xmldeklaration.htm

        weshalb kein UTF-8?

        Weshalb sollte UTF-8 genommen werden?

        Grüße
        Thomas

        1. Moin,

          Hallo,

          Verwende die XML-Deklaration:
          <?xml version="1.0" encoding="iso-8859-1"?>

          http://de.selfhtml.org/xml/regeln/xmldeklaration.htm

          weshalb kein UTF-8?

          Weshalb sollte UTF-8 genommen werden?

          Weil damit sämtliche Zeichen der Welt (außer Klingonisch) dargestellt werden können, ohne auf Entities zurückgreifen zu müssen (somit ist eine etwaige Konvertierung in ein Reintextformat, etwa für Mails, auch wesentlich einfacher), und UTF-8-Unterstützung ohnehin Voraussetzung für jeden XML-Parser ist.

          Tschau,
          Martin

          1. Hallo

            Weil damit sämtliche Zeichen der Welt (außer Klingonisch) dargestellt werden können

            Sicher? ;-)

            http://home.att.net/~jameskass/klingonsampleutf.htm

            Tschö, Auge

            --
            Die Musik drückt aus, was nicht gesagt werden kann und worüber es unmöglich ist zu schweigen.
            (Victor Hugo)
            Veranstaltungsdatenbank Vdb 0.1
            1. Hallo Auge.

              http://home.att.net/~jameskass/klingonsampleutf.htm

              Ich kann es drehen und wenden, wie ich will, die klingonischen Zeichen sind nicht darstellbar.

              Eine entsprechende Schriftart ist aber installiert und wird auch auf das Dokument angewandt, wenn ich in die Adressleiste „javascript:void(document.body.style.fontFamily='klingon')“ eingebe. Jedoch nur auf die normalen Zeichen, alle anderen werden unverändert dargestellt.

              Einen schönen Dienstag noch.

              Gruß, Ashura

              --
              sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
              mathbr:del.icio.us/ mathbr:w00t/
              1. Hallo,

                http://home.att.net/~jameskass/klingonsampleutf.htm

                Ich kann es drehen und wenden, wie ich will, die klingonischen Zeichen sind nicht darstellbar.

                Das macht nichts ;)
                Wenn ich mir http://www.kli.org/ anschaue, muss ich mich so oder so fragen ob die Leute echt nichts mehr bessers zu tun haben in und mit ihrem Leben (als z.B. Gilgamesch oder Shakespeare auf Klingonsich zu "übersetzen")?

                Grüße
                Thomas

            2. Moin,

              Hallo

              Weil damit sämtliche Zeichen der Welt (außer Klingonisch) dargestellt werden können

              Sicher? ;-)

              http://home.att.net/~jameskass/klingonsampleutf.htm

              Ich sehe da nur Fragezeichen. Ich dachte eigentlich, dass Klingonisch nicht in Unicode aufgenommen wurde.

              Tschau,
              Martin

          2. Hallo,

            weshalb kein UTF-8?

            Weshalb sollte UTF-8 genommen werden?

            Weil damit sämtliche Zeichen der Welt (außer Klingonisch) dargestellt werden können,

            Er braucht aber nicht sämtliche Zeichen der Welt (was sogar bei Unicode einstweilen unmöglich ist), sondern nur deutsche Umlaute etc. und das möglichst einfach. Und von dem was er geschildert hat, hat sein Editor ein Problem mit Unicode.

            Grüße
            Thomas

            1. Hello out there!

              Und von dem was er geschildert hat, hat sein Editor ein Problem mit Unicode.

              Woraus willst du das geschlossen haben? „Eventuell liegt das an meinem Editor […]“ [shev] Eventuell liegt es aber daran, dass er gar nicht weiß, ob/wie sein Editor in UTF-8 abspeichern kann: „Speichern unter …“

              Und was haben Probleme mit Unicode mit UTF-8 zu tun? Textpad beispielsweise kann kein Unicode, kann aber problemlos in UTF-8 abspeichern.

              See ya up the road,
              Gunnar

              --
              “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)