tanja: Python & Umlaute

hi,
bei mir generiert python wortlisten aus einer datenbank und leider scheint es mit umlauten nicht umgehen zu können. so werden wörter immer vor dem umlaut abgeschnitten, z.b. "wörter" -> "w"
würde mich freuen, wenn es möglich wäre, diesen "bug" zu umgehen...
denn ich will die anwendung wirklich nicht umschreiben für eine andere programmiersprache.
danke

  1. Hi,

    danke

    bitte. Und nun lies Dir Dein eigenes Posting bitte noch einmal durch und beantworte mir anschließend die Frage, wie Dir irgend jemand helfen können soll.

    Cheatah

    --
    X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. bitte. Und nun lies Dir Dein eigenes Posting bitte noch einmal durch und beantworte mir anschließend die Frage, wie Dir irgend jemand helfen können soll.

      ich bin mir sicher, dass einige hier dieses problem kennen und auch schon eine lösung haben, die python anwendung in die lage bringt, mit umlauten umzugehen, als wären es "normale" buchstaben.
      wo genau das unglück in der anwendung passiert, weiß ich leider auch nicht genau, da ich kein debugging für python habe/kenne. jedoch kann ich sagen, dass die begriffe (mit umlauten) u.a. in tupels und lists verarbeitet werden und evt dort abgeschnitten werden.
      ihr kennt das doch sicher, oder?

      1. Hi,

        ich bin mir sicher, dass einige hier dieses problem kennen und auch schon eine lösung haben, die python anwendung in die lage bringt, mit umlauten umzugehen, als wären es "normale" buchstaben.

        die Anzahl der Faktoren, die eine Rolle spielen können, geht gegen unendlich. Die Wahrscheinlichkeit, den oder die entscheidenden Faktoren zu kennen _und zufällig zu erraten_ geht gegen den Kehrwert davon. Wenn Du hier Hellseher erwartest, fühle ich mich zwar geehrt, muss Dich jedoch leider enttäuschen. Hellseher werden hier erst nach dem großen PSI-Ereignis im Jahre 2012 erscheinen.

        wo genau das unglück in der anwendung passiert, weiß ich leider auch nicht genau, da ich kein debugging für python habe/kenne.

        Wir sind auch kein Debugger, bedaure.

        jedoch kann ich sagen, dass die begriffe (mit umlauten) u.a. in tupels und lists verarbeitet werden und evt dort abgeschnitten werden.
        ihr kennt das doch sicher, oder?

        Ehrlich gesagt nicht, nein - jedenfalls nicht in der pauschalen Form, die Du hier implizierst. Erschaffe einen minimierten Testfall, der das Problem reproduzieren lässt, und beschreibe die Umgebung, in der er läuft. Vergiss dabei bitte nicht zu erwähnen, bei welcher Aktion eigentlich etwas abgeschnitten wird.

        Cheatah

        --
        X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
        X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
        X-Will-Answer-Email: No
        X-Please-Search-Archive-First: Absolutely Yes
      2. Also Python kann eigentlich ganz gut mit Umlauten umgehen, wenn man die entsprechenden Encodings einsetzt und zum Beispiel Unicode-Strings verwendet.

        Ansonsten siehe Cheatah. Deine Problembeschreibung ist wirklich mächtig mau. Nur so als Beispiel, du könntest die Daten bereits falsch in die Datenbank eintragen, du könntest ISO 8859-1 als Encoding der Daten, die du von der Datenbank bekommst, annehmen, dabei sind sie mit Unicode codiert, oder auch umgekehrt, deine Funktion, die die Liste erstellt könnte einen Fehler haben, es könnte ein Virus in deinem System sein, der sich darauf spezialisiert hat, dich zu ärgern und von jedem String alles nach dem ersten nicht US-Ascii Zeichen abschneidet, etc. etc.

        Gruß Ben