Gast: Umlaute sortieren ä = ae

Hallo,

ich habe eine Liste UTF-8 codiert, die per Javascript umsortiert werden kann:

Table sorting script  by Joost de Valk, check it out at http://www.joostdevalk.nl/code/sortable-table/.  
Based on a script from http://www.kryogenix.org/code/browser/sorttable/.  
Distributed under the MIT license: http://www.kryogenix.org/code/browser/licence.html .  

Nun kommen aber die Umlaute ganz zum Schluss. Ich möchte sie aber in deutscher Sortierung, also ä=ae, ß=ss usw.

Geht das mit Javascript?

Gruß, Gast

  1. Nun kommen aber die Umlaute ganz zum Schluss. Ich möchte sie aber in deutscher Sortierung, also ä=ae, ß=ss usw.

    Geht das mit Javascript?

    Natürlich - das Stichwort "Accent Folding" ist für dich interessant - im prinzip normalisierst du die Eingabe zuerst und sortierst anhand der normalisierten Liste.

    Dabei hast du natürlich den Nachteil (oder Vorteil) dass du nicht zuerst ä und dann ae bekommst sondern gemischt, da beides dann quasi "dasselbe Zeichen" darstellt.

    1. Natürlich - das Stichwort "Accent Folding" ist für dich interessant - im prinzip normalisierst du die Eingabe zuerst und sortierst anhand der normalisierten Liste.

      Danke. Habe ich mit PHP gemacht:

          // sort_name a=ae, ö=oe ... fuer Javascript-Sortierung der Liste  
          $sort_name   = mb_strtolower($row_adr['nname']." ".$row_adr['vname']);  
          $arr_search  = array("ä","ö","ü","ß");  
          $arr_replace = array("ae","oe","ue","ss");  
          $sort_name   = str_replace( $arr_search, $arr_replace, $sort_name);  
      
      

      $sort_name gebe ich vor dem "normalen" Namen aus mit display:none. Das klappt.

      Gast

      1. Om nah hoo pez nyeetz, Gast!

        Danke. Habe ich mit PHP gemacht:

        Mit dem Ergebnis, dass der Herr Müller, dann als Mueller auftaucht? Und wenn einer tatsächlich Mueller heißt?

        Vielleicht könntest du die Datensätze duplizieren *

        $person[123] = ('Mueller, Juergen', 'Müller, Jürgen');
        $person[718] = ('Mueller, Joerg', 'Mueller, Jörg');
        sort ($person);

        und nur $person[$k][1] ausgeben?

        * Ressourcenschonend ist anders

        Matthias

        --
        Der Unterschied zwischen Java und JavaScript ist größer als der zwischen Schu und Schultheiß.

        1. Hallo Matthias,

          Mit dem Ergebnis, dass der Herr Müller, dann als Mueller auftaucht? Und wenn einer tatsächlich Mueller heißt?

          Nein:

          <td><i class=nodisplay>baer juergen</i>Bär, Jürgen</td>

          Ich werfe der Javacript-Sortierroutine lediglich einen Knochen hin, den niemand sieht ;-)

          Gast

          1. @@Gast:

            nuqneH

            Nein:

            <td><i class=nodisplay>baer juergen</i>Bär, Jürgen</td>

            Auch nein.

            Wieso das i-Element missbrauchen? Wieso ein präsentationsbezogener Klassenname?

            <td><span class="sort-string">baer juergen</span>Bär, Jürgen</td>

            oder

            <td data-sort-string="baer juergen">Bär, Jürgen</td>

            Qapla'

            --
            „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
            1. @@Gunnar:

              nuqneH

              Wieso ein präsentationsbezogener Klassenname?

              Ich muss jetzt mal den Thread entführen - ich bitte den OP um Entschuldigung.

              Es geht mir nicht um die Frage, warum man grundsätzlich *keine* präsentationsbezogenen Klassennamen verwenden soll - das ist schon klar.

              Aber ich stehe, wie viele andere vermutlich auch, des Öfteren vor dem Problem, dass die einzige Gemeinsamkeit der jeweiligen Elemente ihre Darstellung ist.

              Beispiel:
              Textabsätze, deren Text grundsätzlich zentriert werden soll.

              Wie soll man hier einen "generischen" Klassennamen vergeben, der *nicht* präsentationsbezogen ist?

              Gruß Gunther

              1. @@Gunther:

                nuqneH

                Ich muss jetzt mal den Thread entführen - ich bitte den OP um Entschuldigung.

                Das geht schon in Ordnung.

                Aber ich stehe, wie viele andere vermutlich auch, des Öfteren vor dem Problem, dass die einzige Gemeinsamkeit der jeweiligen Elemente ihre Darstellung ist.

                Beispiel:
                Textabsätze, deren Text grundsätzlich zentriert werden soll.

                Wie soll man hier einen "generischen" Klassennamen vergeben, der *nicht* präsentationsbezogen ist?

                Warum werden gerade diese Textabsätze zentriert, andere jedoch nicht? Irgendwas Gemeinsames sollten sie doch haben, ansonsten liegt da vielleicht ein Designfehler vor.

                Und wenn sie wirklich verschieden sind, spricht auch nichts gegen
                .foo, .bar { text-align: center }
                oder
                #baz, #quz { text-align: center }

                Es besteht überhaupt kein Grund, dass sich die gleichartige Darstellung im Markup widerspiegeln sollte.

                Qapla'

                --
                „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                1. @@all:

                  nuqneH

                  Ich antworte hier mal allen, da ihr ja mehr oder weniger das gleiche geschrieben habt ...!

                  Aber ich stehe, wie viele andere vermutlich auch, des Öfteren vor dem Problem, dass die einzige Gemeinsamkeit der jeweiligen Elemente ihre Darstellung ist.

                  Beispiel:
                  Textabsätze, deren Text grundsätzlich zentriert werden soll.

                  Wie soll man hier einen "generischen" Klassennamen vergeben, der *nicht* präsentationsbezogen ist?

                  Warum werden gerade diese Textabsätze zentriert, andere jedoch nicht? Irgendwas Gemeinsames sollten sie doch haben, ansonsten liegt da vielleicht ein Designfehler vor.

                  Letzteres soll man ja nie ausschließen ... ;-).
                  Aber gehen wir mal davon aus, dass dem nicht so ist.

                  Tatsächlich können die Gründe durchaus sehr verschieden sein (deshalb hatte ich ja geschrieben:"... die einzige Gemeinsamkeit der jeweiligen Elemente ihre Darstellung ist")

                  Und wenn sie wirklich verschieden sind, spricht auch nichts gegen
                  .foo, .bar { text-align: center }

                  Ja, das ist der "konsequente" (und richtige) Weg.
                  Der "Wunsch" das CSS nicht (noch) weiter "aufzublähen", würde hier zu einer "Verunreinigung" im Markup führen.

                  Es besteht überhaupt kein Grund, dass sich die gleichartige Darstellung im Markup widerspiegeln sollte.

                  FACK.

                  Dank nochmal an alle.

                  Gruß Gunther

                  1. @@Gunther:

                    nuqneH

                    Der "Wunsch" das CSS nicht (noch) weiter "aufzublähen", würde hier zu einer "Verunreinigung" im Markup führen.

                    Warum sollte solch ein Wunsch bestehen? Das Stylesheet ist ein Dokument (einmal übertragen, dann im Cache), HTML-Dokumente hingegen gibt es viele (die dasselbe Styelsheet referenzieren).

                    Es sollte der HTML-Code klein gehalten werden. Das macht ein etwas größeres Stylesheet mehr als wett.

                    Qapla'

                    --
                    „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
              2. Hallo,

                Wieso ein präsentationsbezogener Klassenname?
                Ich muss jetzt mal den Thread entführen - ich bitte den OP um Entschuldigung.

                Es geht mir nicht um die Frage, warum man grundsätzlich *keine* präsentationsbezogenen Klassennamen verwenden soll - das ist schon klar.

                Aber ich stehe, wie viele andere vermutlich auch, des Öfteren vor dem Problem, dass die einzige Gemeinsamkeit der jeweiligen Elemente ihre Darstellung ist.

                Beispiel:
                Textabsätze, deren Text grundsätzlich zentriert werden soll.

                Wie soll man hier einen "generischen" Klassennamen vergeben, der *nicht* präsentationsbezogen ist?

                Aber hat man in den meisten™ Fällen nicht auch einen Grund warum man das tut? Dann würde man doch diesen Grund als Klassennamen nehmen. Du machst doch nicht wahllos Text zentriert, sondern nur bestimmten Text aus einem bestimmten Grund (gut dieser Grund könnte auch der aktuelle Hormonspiegel sein, da wäre "zentrierterText" der bessere Name im Vergleich zu "HormonXYZStand123"

                Also warum möchtest du aktuell bestimmte Textabsätze zentriert haben? Sind es Gedichte, Verse, Hinweise, Wetterberichte, ....

                Frag dich nach dem Grund, dass du das so gestalten willst (den muss es ja geben, bzw es muss ja was gegen Blocksatz oder rechts/linksbündigen Text sprechen) Also was unterscheidet diesen Text inhaltlich vom restlichen Text?

                martachen

              3. Hallo,

                Aber ich stehe, wie viele andere vermutlich auch, des Öfteren vor dem Problem, dass die einzige Gemeinsamkeit der jeweiligen Elemente ihre Darstellung ist.

                Beispiel:
                Textabsätze, deren Text grundsätzlich zentriert werden soll.

                dann drängt sich mir immer die Frage auf: Warum soll ausgerechnet da der Text anders sein als in den übrigen Absätzen? Ich bin dann bestrebt, dieses objektive, von der Art der Darstellung unabhängige Merkmal zu finden, das gerade diesen Absatz zu etwas Besonderem macht:

                Ist es ein wichtiger Hinweis?
                Fasst er etwas kurz und prägnant zusammen?
                Soll es einfach ein Eyecatcher sein?
                Möchte ich ein Beispiel geben?

                Wie soll man hier einen "generischen" Klassennamen vergeben, der *nicht* präsentationsbezogen ist?

                Das kann ich bei deiner Fragestellung nicht beantworten, weil der Grund der Anders-Darstellung immer ein anderer sein mag, aber ich bin sicher, es gibt ihn. Und wenn nicht, dann hat die Anders-Darstellung doch anscheinend keinen Sinn.

                So long,
                 Martin

                --
                Vor drei Wochen zog man abends noch einen Pullover an, weil's kühl war, und jetzt weiß man nicht, was man noch ausziehen soll ...
                Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
      2. Hi!

        Natürlich - das Stichwort "Accent Folding" ist für dich interessant - im prinzip normalisierst du die Eingabe zuerst und sortierst anhand der normalisierten Liste.

        Danke. Habe ich mit PHP gemacht:

        // sort_name a=ae, ö=oe ... fuer Javascript-Sortierung der Liste

        $sort_name   = mb_strtolower($row_adr['nname']." ".$row_adr['vname']);
            $arr_search  = array("ä","ö","ü","ß");
            $arr_replace = array("ae","oe","ue","ss");
            $sort_name   = str_replace( $arr_search, $arr_replace, $sort_name);

          
        Ich würde gar nicht so einen Aufwand betreiben.  
        ~~~php
          
        $arr = array("Wißkirchen", "Müller", "Schmitz", "Asbach", "Schulze", "Mueller", "Wisskirchen", "Maier", "Meier", "Zeppelin", "Mutzke");  
        asort($arr);  
        print_r($arr);  
        
        

        Ausgabe:

          
        Array ( [3] => Asbach [7] => Maier [8] => Meier [5] => Mueller [10] => Mutzke [1] => Müller [2] => Schmitz [4] => Schulze [6] => Wisskirchen [0] => Wißkirchen [9] => Zeppelin )  
        
        

        Das deckt sich imho mit der Reihenfolge im Alphabet.

        Und ggf. vorher noch

          
        setlocale (LC_ALL, 'de_DE.utf-8');  
        
        

        setzen, jenachdem welche Locale-Einstellung auf dem entsprechenden System gesetzt ist.

        Gruß Gunther

        1. Om nah hoo pez nyeetz, Gunther!

          Array ( [3] => Asbach [7] => Maier [8] => Meier [5] => Mueller [10] => Mutzke [1] => Müller [2] => Schmitz [4] => Schulze [6] => Wisskirchen [0] => Wißkirchen [9] => Zeppelin )

          
          > Das deckt sich imho mit der [Reihenfolge im Alphabet](http://de.wikipedia.org/wiki/Deutsches_Alphabet#Reihenfolge).  
            
          gewünscht ist aber eine Einsortierung der Umlaute, also Mueller - Müller - Mutzke  
            
          Matthias
          
          -- 
          Der Unterschied zwischen Java und JavaScript ist größer als der zwischen [Messer und Messergebnis](http://selfhtml.apsel-mv.de/java-javascript/index.php?buchstabe=M#messer).  
          ![](http://www.billiger-im-urlaub.de/kreis_sw.gif)  
          
          
          1. Om nah hoo pez nyeetz, Matthias!

            Array ( [3] => Asbach [7] => Maier [8] => Meier [5] => Mueller [10] => Mutzke [1] => Müller [2] => Schmitz [4] => Schulze [6] => Wisskirchen [0] => Wißkirchen [9] => Zeppelin )

            
            > > Das deckt sich imho mit der [Reihenfolge im Alphabet](http://de.wikipedia.org/wiki/Deutsches_Alphabet#Reihenfolge).  
            >   
            > gewünscht ist aber eine Einsortierung der Umlaute, also Mueller - Müller - Mutzke  
              
            Ja, schon klar. ;-)  
            Ich hätte das genauer Erläutern sollen, was ich hiermit jetzt nachhole.  
              
            Das "Problem" bei jeglichen Sortierungen dieser Art ist, dass es nicht nur \*eine\* und somit einheitliche Sortierreihenfolge gibt (vgl. <http://de.wikipedia.org/wiki/Alphabetische_Sortierung> und <http://www.allegro-c.de/papiere/umlaute.htm>).  
              
            Das bedeutet in letzter Konsequenz eigentlich, dass man sowieso \*seine\* verwendete Sortierung textlich erläutern muss, da man eben nicht davon ausgehen kann, dass jeder Besucher/ Nutzer der Liste "intuitiv" die auch tatsächlich verwendete Sortierung annimmt.  
              
            Daraus folgt imho wiederum, dass es prinzipiell eigentlich egal ist, welche Sortierung man verwendet (solange man diese konsequent beibehält).  
              
            Und wenn es "egal" ist, dann würde ich immer die Variante mit dem geringsten Aufwand wählen.  
              
            Ursprünglich hat der OP ja nur von Javascript gesprochen. In einem Folgeposting war dann auf einmal von PHP die Rede. Letzteres lässt mich fast vermuten, dass die Daten aus einer DB kommen, was dann wiederum die Frage aufwirft, warum dort nicht gleich "eine passende" Kollation verwendet wird?  
              
            Und falls die Daten doch nicht aus einer DB kommen, stellt sich die Frage, warum nicht? ;-)  
              
            Fazit: Ich würde mich an eine der "vorhandenen" Sortierungen halten, da ich in einer eigenen Sortierfunktion nur zusätzlichen Aufwand ohne entsprechenden Mehrwert sehe.  
              
            Gruß Gunther
            
            1. Hallo Gunther,

              Ursprünglich hat der OP ja nur von Javascript gesprochen. In einem Folgeposting war dann auf einmal von PHP die Rede. Letzteres lässt mich fast vermuten, dass die Daten aus einer DB kommen, was dann wiederum die Frage aufwirft, warum dort nicht gleich "eine passende" Kollation verwendet wird?

              Die Daten kommen aus einer DB und können dann per Javascript nach Spalten neu sortiert werden, ohne die HTML Seite neu zu laden.

              Die "passende" DB-Kollation nutzt Javasript nichts, so weit ich weiss.

              Gruß Gast

        2.   
          
          > Array ( [3] => Asbach [7] => Maier [8] => Meier [5] => Mueller [10] => Mutzke [1] => Müller [2] => Schmitz [4] => Schulze [6] => Wisskirchen [0] => Wißkirchen [9] => Zeppelin )  
          
          

          Das deckt sich imho mit der Reihenfolge im Alphabet.

          Laut dem Wikipedia-Artikel tut es genau das nicht.

          1. Hi!

            Laut dem Wikipedia-Artikel tut es genau das nicht.

            Inwiefern nicht?
            Bitte beachte, dass es hierbei um "die Reihenfolge im Alphabet" geht - nicht um eine spezielle Sortierreihenfolge.

            Siehe auch meine Antwort auf Matthias Posting.

            Gruß Gunther

            1. Laut dem Wikipedia-Artikel tut es genau das nicht.
              Inwiefern nicht?

              Nehmen wir mal den interessanten Teil aus deinem Beispiel:

              Mutzke [1] => Müller [2]

              "Mutzke" kommt hier vor "Müller".
              Laut Wikipedia sind "u" und "ü" beide an Stelle 21 des Alphabets. D.h. "Mu" und "Mü" sind gleichwertig, folglich wird der nächste Buchstabe zum Vergleich herangezogen. "MuTzke" gegen "MüLler" heißt es dann.
              Die Reihenfolge müsste also "Müller, Mutzke" sein, um sich mit der des Alphabets zu vertragen.

              1. Laut dem Wikipedia-Artikel tut es genau das nicht.
                Inwiefern nicht?

                Nehmen wir mal den interessanten Teil aus deinem Beispiel:

                Mutzke [1] => Müller [2]

                "Mutzke" kommt hier vor "Müller".
                Laut Wikipedia sind "u" und "ü" beide an Stelle 21 des Alphabets. D.h. "Mu" und "Mü" sind gleichwertig, folglich wird der nächste Buchstabe zum Vergleich herangezogen. "MuTzke" gegen "MüLler" heißt es dann.
                Die Reihenfolge müsste also "Müller, Mutzke" sein, um sich mit der des Alphabets zu vertragen.

                Nein, eben genau nicht. Du bist schon bei der *Sortierreihenfolge* (bspw. in Namenslisten). Das ist ja genau der Unterschied, auf den ich hingewiesen habe.

                Die *Reihenfolge* besagt lediglich, dass bspw. 'Ä,ä' zu 'A,a' gehört und nicht etwa hinter 'Z,z' kommt.

                Mit der Besonderheit:"Das ẞ/ß (Eszett) kann entweder gleichgestellt mit dem S/s oder nach dem Z/z zugefügt werden."

                Gruß Gunther

                1. Nein, eben genau nicht. Du bist schon bei der *Sortierreihenfolge* (bspw. in Namenslisten). Das ist ja genau der Unterschied, auf den ich hingewiesen habe.

                  Reden wir aneinander vorbei oder steh ich nur voll aufm Schlauch?
                  Wieso ziehst du die alphabetische Reihenfolge heran, wenn du doch nicht danach sortieren möchtest?

                  "Die *Reihenfolge* besagt lediglich, dass bspw. 'Ä,ä' zu 'A,a' gehört und nicht etwa hinter 'Z,z' kommt."
                  Und zum Beispiel auch das "t" wie in "MuTzke" nach "l" wie in "MüLler" kommt.

                  1. Reden wir aneinander vorbei ...?

                    Scheint so ...! ;-)

                    Wieso ziehst du die alphabetische Reihenfolge heran, wenn du doch nicht danach sortieren möchtest?

                    Ich möchte ja - der OP aber nicht.

                    Ich versuch' es mal anders zu erklären:
                    Reihenfolge gibt es nur eine - Sortierungen mehrere!

                    Deshalb steht ja auch unter der Reihenfolge:"Diese Reihenfolge gilt nicht für alle Sortieralgorithmen, insbesondere bei der Einordnung von Wörtern mit Umlauten oder Eszett kann es Abweichungen geben."

                    Der Rest sollte sich dann aus der Antwort auf Matthias' Posting ergeben.

                    Gruß Gunther

                    1. Hallo,

                      Reihenfolge gibt es nur eine - Sortierungen mehrere!

                      nein, eine Reihenfolge entsteht ja durch Sortierung. Verschiedene Sortierungen führen also zu verschiedenen Reihenfolgen.

                      Deshalb steht ja auch unter der Reihenfolge:"Diese Reihenfolge gilt nicht für alle Sortieralgorithmen, insbesondere bei der Einordnung von Wörtern mit Umlauten oder Eszett kann es Abweichungen geben."

                      Ich glaube, in diesem Satz steckt der entscheidende Knackpunkt: Der eine redet von der Reihenfolge von _Buchstaben_ im Alphabet, der andere von der Reihenfolge ganzer _Wörter_ in einem Verzeichnis. Natürlich lehnt sich die Sortierung von Wörtern (die eine bestimmte Reihenfolge ergibt) an die alphabetische Reihenfolge der Buchstaben an, berücksichtigt aber ein paar zusätzliche Sonderregeln.

                      Ciao,
                       Martin

                      --
                      Paradox ist, wenn der Innenminister sich äußert und der Außenminister sich erinnert.
                      Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
                      1. Hallo Martin!

                        Reihenfolge gibt es nur eine - Sortierungen mehrere!

                        nein, eine Reihenfolge entsteht ja durch Sortierung. Verschiedene Sortierungen führen also zu verschiedenen Reihenfolgen.

                        Auch Nein! ;-)

                        Zumindest in dem hier vorliegenden Fall ist *die Reihenfolge* erstmal weniger speziell als jedwede Sortierung. *Die Reihenfolge* trifft ja gar keine Aussage darüber, an welcher *Stelle* Umlaute *innerhalb* des zugehörigen Buchstabens stehen - diese ergibt sich erst durch eine *bestimmte* Sortierung!

                        Oder umgekehrt formuliert: Durch eine spezielle Sortierung *ändert' sich ggf. die Position *innerhalb* der (Basis-)Reihenfolge.

                        Und wie ich bereits in meiner anderen Antwort ausgeführt habe, sehe ich keinen Mehrwert darin, extra eine eigene (zusätzliche) Sortierung zu verwenden, sondern würde mich mit einer der bereits verfügbaren Sortierungen begnügen.

                        Die von mir vorgeschlagene Sortierung geht dabei durchaus "konform" zu *der Reihenfolge*!
                        (Mit anderen Worten: Ich würde auf gar keinen Fall eine Sortierung verwenden, deren Ergebnis von *der Reihenfolge* abweicht!)

                        Ich hoffe, es ist jetzt klar geworden, was ich die ganze Zeit über meine? ;-)

                        Gruß Gunther

    2. Natürlich - das Stichwort "Accent Folding" ist für dich interessant

      Nein, das nennt sich Collation und betrifft mehr als nur Akzente.

      Die Unicodeunterstützung (d.h. UTS #10) in PHP und Javascript ist immer noch so'n Schaaß, dass man das am besten der Datenbank überlässt.

    3. @@suit:

      nuqneH

      Dabei hast du natürlich den Nachteil (oder Vorteil) dass du nicht zuerst ä und dann ae bekommst sondern gemischt, da beides dann quasi "dasselbe Zeichen" darstellt.

      Wieso Nachteil? Das ist genau das, was man bei der Telefonbuchsortierung gern hätte.

      Qapla'

      --
      „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
      1. Wieso Nachteil? Das ist genau das, was man bei der Telefonbuchsortierung gern hätte.

        Darum schrieb ich in Klammer "Vorteil" dazu, weil das nicht ganz klar ist zumal es ja auch z.B. wenn man bei deinemn Telefonbuchbeispiel bleibt, die absichtlich mit z.B. oe geschrieben werden - Goethe ist hier ein Klassiker.

        Nehmen wir die folgende Liste:
        Göacker
        Goethe (wenn oe in der Sortierung allein steht, wie es sich hier gehört)
        Gössl

        Oder aber

        Göacker
        Gössl
        Goethe (wenn oe in der Sortierung in ö überführt [oder umgekehrt bei den anderen], was bei Goethe falsch wäre, steht das t nach dem s  im Alphabet)

        Das sind Nebeneffekte die man besonders bei Namensschreibweisen nicht restlos und sauber erfassen kann - das Goethe-Beispiel ist allerdings nicht das Beste, da hier das oe meines Wissens nach als ö gesprochen wird.

        Andere Beispiele wären z.B. die Stadt Soest, hier wird das oe nicht als ö gesprochen oder wenn man z.B. die Aleuten nimmt, da entspricht das eu nicht dem deutschen "EU" sondern der dem e mit Tremata ë welches als getrennt langezogenes e gesprochen wird.

        1. Hallo,

          Wieso Nachteil? Das ist genau das, was man bei der Telefonbuchsortierung gern hätte.
          Darum schrieb ich in Klammer "Vorteil" dazu, weil das nicht ganz klar ist zumal es ja auch z.B. wenn man bei deinemn Telefonbuchbeispiel bleibt, die absichtlich mit z.B. oe geschrieben werden - Goethe ist hier ein Klassiker.

          Nehmen wir die folgende Liste:
          Göacker
          Goethe (wenn oe in der Sortierung allein steht, wie es sich hier gehört)
          Gössl

          Oder aber

          Göacker
          Gössl
          Goethe (wenn oe in der Sortierung in ö überführt [oder umgekehrt bei den anderen], was bei Goethe falsch wäre, steht das t nach dem s  im Alphabet)

          Das sind Nebeneffekte die man besonders bei Namensschreibweisen nicht restlos und sauber erfassen kann - das Goethe-Beispiel ist allerdings nicht das Beste, da hier das oe meines Wissens nach als ö gesprochen wird.

          deswegen gibt es ja alternativ zur Telefonbuch-Sortierung die sogenannte Wörterbuch-Sortierung, bei der etwa ö, ô oder ó alle wie o einsortiert werden, was mir logischer und sinnvoller erscheint - schließlich sind das alles nur abgewandelte Formen des Buchstaben o.

          Andere Beispiele wären z.B. die Stadt Soest, hier wird das oe nicht als ö gesprochen oder wenn man z.B. die Aleuten nimmt, da entspricht das eu nicht dem deutschen "EU" sondern der dem e mit Tremata ë welches als getrennt langezogenes e gesprochen wird.

          Solche Überlegungen spielen bei der Wörterbuch-Sortierung keine Rolle; hier kommt Soest nach Soda, aber vor Softie, und Käse zwischen Karre und Katze, nicht vor beiden.

          Übrigens führt dein Beispiel mit der eu-Kombination IMO wieder etwas vom Thema weg, da "eu" in keiner mir bekannten Sortierung als Einheit betrachtet wird - egal ob als gleitender Laut wie in "Leute" oder getrennt wie in "Aleuten".

          Ciao,
           Martin

          --
          Frage an Radio Eriwan: Kann man eigentlich ein guter Kommunist und gleichzeitig ein guter Christ sein?
          Radio Eriwan antwortet: Im Prinzip ja - aber warum sollte man sich das Leben doppelt schwer machen?
          Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
          1. @@Der Martin:

            nuqneH

            deswegen gibt es ja alternativ zur Telefonbuch-Sortierung die sogenannte Wörterbuch-Sortierung, bei der etwa ö, ô oder ó alle wie o einsortiert werden, was mir logischer und sinnvoller erscheint

            Nicht dem Rest der Welt. Nicht bei deutschen Namen.

            Qapla'

            --
            „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
  2. Geht das mit Javascript?

    String.prototype.localeCompare [mdn] ist genau für solche Zwecke gedacht. Leider hinken die Browser mit ihren Implementationen hinterher. Auch interessant in dem Zusammenhang ist Intl.Collator [mdn], die Browserunterstützung ist leider auch nicht besser.

  3. Hallo Gast,

    Nun kommen aber die Umlaute ganz zum Schluss. Ich möchte sie aber in deutscher Sortierung, also ä=ae, ß=ss usw.

    du kannst es ja mal mit einem deutschen Produkt versuchen:

    Tabellensortierer

    Beispiel mit Umlauten etc.

    Gruß, Jürgen

    1. Hallo Jürgen,

      du kannst es ja mal mit einem deutschen Produkt versuchen:

      Tabellensortierer

      Beispiel mit Umlauten etc.

      Danke, habe eine Tabelle umgestellt. Sortierung funktioniert gut mit Umlauten.

      Gruß, Gast