Ron: UTF-8 und CMS... Frage zur Abspeicherung

Hallo,

Wenn ich den Zeichensatz auf UTF-8 umstelle muss ich doch, bei statischen Seiten, die HTML-(oder PHP)-Seiten mit einem Editor als UTF-8 abspeichern.
Gilt das grundsätzlich für alle Seiten die Verwendung finden? Z.B. CSS-Dateien? Oder nur in denen Seiten die Content beinhalten?

Und wie ist das bei einem PHP-CMS? Wenn ich das auf UTF-8 umstelle (z.B. per .htaccess) muss ich doch auch alle Dateien als UTF-8 abspeichern, oder?
Oder gilt das nur für Templates und Seiten die Content beinhalten, oder Content verarbeiten?

Was passiert eigentlich wenn ich das nicht mache? Kann es sein das ich Probleme mit der Content-Lenght im Header bekomme?

Gruß Ron

  1. Hi,

    Wenn ich den Zeichensatz auf UTF-8 umstelle muss ich doch, bei statischen Seiten, die HTML-(oder PHP)-Seiten mit einem Editor als UTF-8 abspeichern.
    Gilt das grundsätzlich für alle Seiten die Verwendung finden? Z.B. CSS-Dateien?

    besser ist das.

    Und wie ist das bei einem PHP-CMS? Wenn ich das auf UTF-8 umstelle (z.B. per .htaccess) muss ich doch auch alle Dateien als UTF-8 abspeichern, oder?

    Das Problem lässt sich mit dem folgenden Satz darstellen:

    This sentence has been written in French.

    Nun überlege Dir, was passiert, wenn Du z.B. über die Server-Konfiguration eine Ressource als Französisch ausgibst, sie aber in Englisch verfasst ist. Die gute Nachricht lautet: Die Übersetzung Englisch=>Französisch ist verhältnismäßig leicht.

    Oder gilt das nur für Templates und Seiten die Content beinhalten, oder Content verarbeiten?

    Das kommt darauf an, auf welche Weise der o.g. Satz zusammengebaut wird. Möglich ist es durchaus, die PHP-Codes in ISO-8859-13 (oder was-weiß-ich) abzuspeichern und trotzdem perfektes UTF-8 zu produzieren. Die Frage ist eher: Welchen Grund sollte man haben, sowas tun zu wollen?

    Was passiert eigentlich wenn ich das nicht mache?

    Nikto ist able à verstaan tjebja.[1]

    Kann es sein das ich Probleme mit der Content-Lenght im Header bekomme?

    Nur wenn Du sie selbst in den Header schreibst.

    Cheatah

    [1] Bin gerade zu faul, kyrillische Zeichen zu suchen. Man denke sie sich bitte an geeigneten Stellen hinzu.

    --
    X-Self-Code: sh:( fo:} ch:~ rl:| br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. Hi,

      danke für deine Antworten...

      Kann es sein das ich Probleme mit der Content-Lenght im Header bekomme?

      Nur wenn Du sie selbst in den Header schreibst.

      Eigentlich alles logisch ;)
      Hab mir jetzt auch einiges zum Thema UTF-8 / Header etc. im Netzt durchgelesen.

      Aber in der Praxis wird es schwierig.
      Ich code mit Phase5 und der kann kein UTF-8.

      Jetzt habe ich mir nen Editor geholt (Unired) kann man alles toll einstellen, doch wenn ich dann speichere und später wieder öffne steht wieder die alte da (Windows).

      Mit Dreaweaver geschaut und da steht immer westlich unter Page/ Properties, wenn ich es auf UFT-8 ändere will dreamwaver per php das ins Dokument schreiben, bei includeten dateien macht das ja kein sinn.

      Beim abspeichern mit Dreamweaver wird man nicht gefragt mit was für ner Kodierung das Dokument selbst abgespeichert werden soll.

      Dachte Dreamweaver oder Unired könnten das...

      Die andere Frage die ich dazu habe.
      Bei einem CMS aus dritter Hand, mehreren 100 PHP-/ Template-Seiten, muss dann jede Seite einzeln als UTF-8 abgespeichert werden? Ich weiß ja nicht als was es diejenigen die das CMS geschrieben haben abgespeichert haben.
      Oder gibt es da eine Möglichkeit das zu automatisieren?
      Oder muss das gar nicht?

      Jedenfalls hoffe ich mit der Umstellung auf UTF-8 des gesamten CMS endlich mein Problem mit der Content-Lenght in den Griff zu kriegen, obwohl ich auch augenscheinlich keine Darstellungsfehler bzgl. Zeichenkodierung habe obwohl ich keine Ahnung habe ob die CMS-Dokumente UTF-8 abgespeichert sind, denke nicht, da Phase5 das ja nicht kann, ich aber Änderungen an Dateien vorgenommen habe.
      Per .htaccess ist es jedenfalls eingestellt und wird auch vom Browser so empfangen (Ressource-Header).

      Irgndwie verstehe ich es, aber ein paar Grundlagen fehlen wohl noch, oder ich denke zu kompliziert, vielleicht kannst du mir ja helfen?

      Gruß Ron

      1. Ich code mit Phase5 und der kann kein UTF-8.

        notepad++ ist dein freund - ich hab mich auch vor einiger zeit von proton (der editor-komponente von phase) getrennt um zu notepad++ zu welchseln: im nachhinein betrachtet, ich hätt es früher tun sollen

        Dreamweaver
        Dreamweaver
        Dreamweaver

        bei der frequenz kotzen sogar pferde :D

        Oder gibt es da eine Möglichkeit das zu automatisieren?

        ja sicher, stapelverarbeitung nennt sich das - das geht mit so ziemlich allem, was stupide und monoton ist

        Oder muss das gar nicht?

        sieh dir die files an

      2. Hi,

        danke für deine Antworten...

        gerne. Da suit schon alles Weitere gesagt hat, erlaube ich mir, mich auf eine kleine Anmerkung zu beschränken:

        [...] Content-Lenght [...]
        [...] Content-Lenght [...]

        Zwei mal der selbe Fehler ist üblicherweise kein Typo mehr. Der Begriff schreibt sich "length", nicht "lenght".

        Cheatah

        --
        X-Self-Code: sh:( fo:} ch:~ rl:| br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
        X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
        X-Will-Answer-Email: No
        X-Please-Search-Archive-First: Absolutely Yes
  2. Hallo,

    mich würde folgendes in diesem Zusammenhang noch interessieren: Im Notepad++ habe ich die Möglichkeit (in anderen Editoren sicher auch), mit und ohne "BOM" zu speichern. Ist eine Version der anderen vorzuziehen?

    Mit freundlichem Gruß
    Micha

    1. Hallo,

      mich würde folgendes in diesem Zusammenhang noch interessieren: Im Notepad++ habe ich die Möglichkeit (in anderen Editoren sicher auch), mit und ohne "BOM" zu speichern. Ist eine Version der anderen vorzuziehen?

      es gibt auch Editoren, die UTF-8 nur mit BOM abspeichern können ;-)
      Grundsätzlich ist für UTF-8 die Angabe einer Byte Order Mark nicht erforderlich, manchmal kann sie auch sehr störend sein, wie diverse Archivbeiträge zu seltsamen drei Zeichen belegen.

      Noch ein Link zu einem aktuellen Thread.

      Freundliche Grüße

      Vinzenz, der stets ohne "BOM" speichert

    2. @@Micha:

      Im Notepad++ habe ich die Möglichkeit (in anderen Editoren sicher auch), mit und ohne "BOM" zu speichern. Ist eine Version der anderen vorzuziehen?

      Ohne. [QA-UTF8-BOM]

      Live long and prosper,
      Gunnar

      --
      Das einzige Mittel, den Irrtum zu vermeiden, ist die Unwissenheit. (Jean-Jacques Rousseau)
    3. Hallo,

      Danke Euch beiden!

      Mit freundlichem Gruß
      Micha