Antwort an „Felix Riesterer“ verfassen

Lieber Gerhard,

wir haben im Deutschen ohnehin zweierlei Reihenfolgen für Sortierungen. Welche darf es denn nun sein? DIN 5007 Variante 1 („Lexikon“), oder DIN 5007 Variante 2 („Telefonbuch“)?

Je simpler ein Sortieralgorithmus arbeitet, desto mehr orientiert er sich an der Hausnummer, die das jeweilige Zeichen in der Codierung hat. Bei Buchstaben des englischen Alphabets (A-Z) ist das ja einfach, da hier die Zahlen 65 bis 90 zu vergleichen sind. Spannender wird es bei den Umlauten (ÄÖÜ) und dem Esszett (ß), welche im Vergleich zu den anderen Buchstaben deutlich höhere Zahlenwerte haben. Das führt Dazu, dass bei einfachen Implementierungen die Wurst vor den Wölfen einsortiert wird:

  1. Wurst
  2. Wölfe

Die oben angesprochenen Varianten der DIN 5007 müssen nun entscheiden, ob sie vor dem Sortieren die Umlaute dadurch ersetzen, dass die beiden Punkte entfernt werden (Ä -> A, Ö -> O usw. entspricht Variante 1), oder dass sie als Ligatur betrachtet werden (Ä = AE, Ö = OE usw. entspricht Variante 2). Ersteres findest Du in Word.

Aber schon Apostroph-Zeichen (wie Dein L'eau vive) sind dann ein Problem: Welches Zeichen genau wurde denn verwendet, und soll das bei der Sortierung eine Rolle spielen?

  1. L'eau vive
  2. L`eau vive
  3. L´eau vive
  4. L´eau vive
  5. L’eau vive
    ...

Raffiniertere Algorithmen ignorieren diese Zeichen komplett und deuten sie nur als Wort-Trenner und sortieren nur die Wörter an sich. Dadurch entsteht „L eau vive“, was mit einem einzelnen L beginnt und deswegen vor „La ballade des gens heureux“ einsortiert wird, da L vor La kommt. Aber das kann der Dateimanager offensichtlich nicht und deutet den Zahlenwert hinter dem Apostroph...

Mir ist nicht bekannt, dass Textverarbeitungen hier eine Einstellmöglichkeit bieten, auch nicht, dass die Dateimanager der diversen Betriebssysteme (oder besser desktop environments) das könnten.

Liebe Grüße

Felix Riesterer

freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar
freiwillig, öffentlich sichtbar

Ihre Identität in einem Cookie zu speichern erlaubt es Ihnen, Ihre Beiträge zu editieren. Außerdem müssen Sie dann bei neuen Beiträgen nicht mehr die Felder Name, E-Mail und Homepage ausfüllen.

abbrechen