kopp: Sch**** Sonderzeichen

Hallo,

Ich arbeite mit Eclipse und stelle den Zeichensatz immer auf ISO damits auch mit der DB keine Probleme gibt. Habe das gesamte Projekt immer mal wieder auf nen Stick gezogen und zuhause weiter gemacht...
jedenfalls ist es bei diesem hin und her kopieren wieder dazu gekommen das die Einstellung im Eclipse wieder auf UTF-8 zurückgesetzt wurde und schon wieder diese sch**** Sonderzeichen. Die gehen mir so auf den Sa**, das kann sich hier keiner mehr vorstellen. Wenn es diese Art von Problemchen nicht geben würde wäre das Leben gleich viel schöner!

Naja meine Frage:
Ich weis ja wie ich es richtig machen muss nur kommt es wie in meinem Fall immer mal wieder vor, dass sich diese kryptischen Zeichen über unsere doofen äö und ü´s legen - da lob ich mir mal wieder die Englische Sprache!
Da ich keine LUST habe immer wieder die kryptischen Zeichen manuell zu erstezen nur weil irgendwo mal wieder irgendwas nicht ganz glatt gelaufen ist, möchte ich mit euch zusammen ein möglichst universellen REPLACE-SCRIPT für genau diesen Fall schreiben, dass man einfach nur einmal ausführen muss und alles ist wieder im lot!

Würde mich freuen wenn wir zusammen alles nötige zusammen tragen könnten um ein solches Script zu entwerfen!

Danke

kopp

  1. Ich arbeite mit Eclipse und stelle den Zeichensatz immer auf ISO damits auch mit der DB keine Probleme gibt.

    welche probleme? meine datenbanken funktionieren auch mit utf-8 einwandfrei

    Ich weis ja wie ich es richtig machen muss

    scheinbar nicht - richtig wäre in den meisten fälle utf-8 zu verwenden

    Würde mich freuen wenn wir zusammen alles nötige zusammen tragen könnten um ein solches Script zu entwerfen!

    die dinger gibts massenhaft - aber üblicherweise in der vernünftigen variante latin1 zu utf-8 oder vergleichbares

    1. Ich arbeite mit Eclipse und stelle den Zeichensatz immer auf ISO damits auch mit der DB keine Probleme gibt.
      welche probleme? meine datenbanken funktionieren auch mit utf-8 einwandfrei

      keine Ahnung irgendwie hatte ich Probleme meine DB auf utf8 umzustellen und standartmäßig stehen die mysql-dbs auf iso, richtig? jedenfalls hats dann immer funktioniert...

      Ich weis ja wie ich es richtig machen muss
      scheinbar nicht - richtig wäre in den meisten fälle utf-8 zu verwenden

      Ne ich mein die sache mit: DB muss den selben Zeichensatz tragen wie das Dokument und die Meta-Tag-Anweisung

      Würde mich freuen wenn wir zusammen alles nötige zusammen tragen könnten um ein solches Script zu entwerfen!
      die dinger gibts massenhaft - aber üblicherweise in der vernünftigen variante latin1 zu utf-8 oder vergleichbares

      wo?

      kopp

      1. standartmäßig

        standard

        stehen die mysql-dbs auf iso, richtig?

        da bin ich jetzt überfragt - latin1_swedish_ci war lange zeit die default-kollation - ggf wurde das aber mittlerweile geändert

        scheinbar nicht - richtig wäre in den meisten fälle utf-8 zu verwenden
        Ne ich mein die sache mit: DB muss den selben Zeichensatz tragen wie das Dokument und die Meta-Tag-Anweisung

        die datenbank, die tabellen, die felder, die verbindung zur datenbank, die scripte und die ausgelieferten files - alles muss richtig codiert sein :)

        wo?

        eine built-in-funktionalität von notepad++ zb - dokumente konvertieren ist damit kein problem - in verschiedenste richtungen

        1. der edit++ kennt nur utf8 und ansi!
          ich darf gar nicht drüber nachdenken wie lange ich jetzt schon wieder wegen diesen blöden sonderzeichen rum mache.. MANN EY

          kopp

          1. der edit++ kennt nur utf8 und ansi!
            ich darf gar nicht drüber nachdenken wie lange ich jetzt schon wieder wegen diesen blöden sonderzeichen rum mache.. MANN EY

            mein notepad++ kennt ansi, utf-8, utf-8 ohne byte order mark, sowie usc-2 mit big oder little endian (aka utf-16)

            und von utf-8 zu ansi konvertieren ist genau das, was du willst

            1. und von utf-8 zu ansi konvertieren ist genau das, was du willst

              sagst du :-)

              das hab ich doch probiert.. ich weiss ja auch nicht was da schief gelaufen ist und was das für zeichen sind die ich da jetzt habe
              zB.: ....... och mann meine preg_match-funktion
              if(!preg_match('/[1]+$/',$chk))
              wasn kack ey! das kam jetzt aber nach der manuellen umstellung auf utf-8 - die zerhackt mir jetzt noch den rest, na super idee!

              ich muss jetzt raus finden wie ich meine mysql-datenbank utf-8-sicher mache und dann muss ich alle Dokumente händisch ändern..
              kostet ja nur wertvolle zeit.. wer ZEICHENSäTZE erfunden hat gehört erschossen!

              kopp


              1. a-zA-Z0-9������._ ↩︎

              1. kostet ja nur wertvolle zeit.. wer ZEICHENSäTZE erfunden hat gehört erschossen!

                dein problem sind nicht die zeichensätze :) charset ist mit zeichencodierung zu übersetzen

                und wer auch immer utf-8 erdacht hat, ist genial gehört geehrt

  2. @@kopp:

    und schon wieder diese sch**** Sonderzeichen.

    Es gibt keine "sch**** Sonderzeichen"; es gibt nur "sch**** Zeichencodierungen". Das sind alle, die nicht mit "UTF" anfangen.

    Verwende überall UTF-8 und alles wird gut.

    Live long and prosper,
    Gunnar

    --
    Das einzige Mittel, den Irrtum zu vermeiden, ist die Unwissenheit. (Jean-Jacques Rousseau)
    1. alles wird gut, jaaaaa, ich dreh gleich durch!!

      was muss ich denn noch alles einstellen damit der ach so tolle zeichensatz greift??

      habe jetzt das Dokument umgestellt mit Eclipse!
      habe META-TAGS geändert in utf-8
      sende einen extra header via php
      und wie stelle ich jetzt die datenbank noch auf utf-8 um?

      das dumme ist nur - am anfang eines projektes geht immer alles und in mitten eines projektes muss ich mich immer wieder mit dieser dummen sch**** rumärgern!

      kopp

      1. und wie stelle ich jetzt die datenbank noch auf utf-8 um?

        http://wolfram.kriesing.de/blog/index.php/2007/convert-mysql-db-to-utf8

        achte aber wie gesagt darauf, dass die datenbankVERBINDUNG ebenfalls mit utf-8 arbeitet ;)

        das dumme ist nur - am anfang eines projektes geht immer alles und in mitten eines projektes muss ich mich immer wieder mit dieser dummen sch**** rumärgern!

        aus dem grund: lieber 2x überlegen und ordentlich machen als schnellschüsse, die dir vorher 20 minuten denken sparen nachher das kreuz brechen und dir tagelange arbeit bescheren

        1. und wie stelle ich jetzt die datenbank noch auf utf-8 um?
          http://wolfram.kriesing.de/blog/index.php/2007/convert-mysql-db-to-utf8

          achte aber wie gesagt darauf, dass die datenbankVERBINDUNG ebenfalls mit utf-8 arbeitet ;)

          Soll ich jetzt jede Tabelle mit diesem SQL-Code ausführen?
          ALTER TABLE tbl_name CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci;

          gibts da keine möglichkeit nen Code in ner htaccess-Datei abzulegen oder so was?

          kopp

          1. Soll ich jetzt jede Tabelle mit diesem SQL-Code ausführen?
            ALTER TABLE tbl_name CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci;

            was spricht dagegen, eine abfrage zu schreiben, die dir alle tabellen namentlich zurückgibt?

            per hand musst du das nicht machen

            im übrigen: du solltest auch die beiden links (die erste beiden worte im text) verfolgen und lesen

            gibts da keine möglichkeit nen Code in ner htaccess-Datei abzulegen oder so was?

            htaccess geht die datenbank nix an

  3. Hi,

    Ich arbeite mit Eclipse und stelle den Zeichensatz immer auf ISO damits auch mit der DB keine Probleme gibt.

    schwerer Fehler. Alles andere als die *konsequente* Nutzung *nur* von UTF rächt sich - garantiert.

    jedenfalls ist es bei diesem hin und her kopieren wieder dazu gekommen das die Einstellung im Eclipse wieder auf UTF-8 zurückgesetzt wurde

    Natürlich - es ist der empfehlenswerte Default.

    und schon wieder diese sch**** Sonderzeichen.

    Natürlich, Du hast sie ja auch zuvor verhunzt.

    Die gehen mir so auf den Sa**, das kann sich hier keiner mehr vorstellen.

    Doch, das kann jeder. Selbst Indiana Jones sagte schon:

    "Encodings. Why did it have to be encodings."

    Naja, seine Encodings waren Schlangen, aber was soll's ... :-)

    Wenn es diese Art von Problemchen nicht geben würde wäre das Leben gleich viel schöner!

    Exakt aus diesem Grund wurde UTF erfunden. *Alles* andere ist deprecated. Benutzung auf eigene Gefahr.

    Würde mich freuen wenn wir zusammen alles nötige zusammen tragen könnten um ein solches Script zu entwerfen!

    Ich hab schon mal ein T-Shirt für Dich: http://www.getdigital.de/products/scheiss_encoding

    Cheatah

    --
    X-Self-Code: sh:( fo:} ch:~ rl:| br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. guden!

      Doch, das kann jeder. Selbst Indiana Jones sagte schon:

      "Encodings. Why did it have to be encodings."

      interessant!

      Ich hab schon mal ein T-Shirt für Dich: http://www.getdigital.de/products/scheiss_encoding

      hahaha Würd ich mir kaufen wenn ich kein Doppel-Leben führen würde und mich als Programmiere Outen könnte. Ich meine meine Freunde wissen zwar was ich mache, aber sowas würde nicht mehr durch gehen :-)

      kopp

      1. Hi kopp!

        aber sowas würde nicht mehr durch gehen :-)

        Du als Programmierer?
        Nein, nein wirklich nicht.

        *scnr* ;-)

        MfG H☼psel

        --
        "It's amazing I won. I was running against peace, prosperity, and incumbency."
        George W. Bush speaking to Swedish Prime Minister unaware a live television camera was still rolling, June 14, 2001
        Selfcode: ie:% fl:( br:> va:) ls:& fo:) rl:? n4:& ss:| de:] js:| ch:? sh:( mo:) zu:)