ae, oe, ue, ss zu Umlauten konvertieren
Sebastian Becker
- php
Hallo,
ich möchte gerne Texte, die ohne deutsche Umlaute - also mit "ae", "oe", "ue", "ss" - gespeichert sind, in die heute auch im Netz übliche Schreibweise zurückverwandeln.
Leider gibt es viele Fälle, wie z.B. das Wort "Tetraeder", wo eine generelle Umwandlung durch Stringfunktionen zu unschönen Ergebnissen führen würde. Ich brauche also vermutlich eine annähernd vollständige Wörterliste sowie eine Funktion, die überprüft, ob ein Wort dort gespeichert ist und es nur dann _nicht_ umwandelt. Dabei sind auch Pluralformen etc. zu beachten.
Hat jemand eine Idee?
Danke für alle kreativen Ideen oder Hinweise, Grüße,
Sebastian
Moin!
ich möchte gerne Texte, die ohne deutsche Umlaute - also mit "ae", "oe", "ue", "ss" - gespeichert sind, in die heute auch im Netz übliche Schreibweise zurückverwandeln.
Leider gibt es viele Fälle, wie z.B. das Wort "Tetraeder", wo eine generelle Umwandlung durch Stringfunktionen zu unschönen Ergebnissen führen würde. Ich brauche also vermutlich eine annähernd vollständige Wörterliste sowie eine Funktion, die überprüft, ob ein Wort dort gespeichert ist und es nur dann _nicht_ umwandelt. Dabei sind auch Pluralformen etc. zu beachten.
Hat jemand eine Idee?
Gib's auf! Es ist für die deutsche Sprache unmöglich, eine vollständige Wortliste zu erstellen. Die Sprache ermöglicht, alle möglichen und unmöglichen Worte zu kombinieren (Donaudampfschifffahrtsgesellschaftskaptitänsmützenschneidereigarn oder so). Dabei können beliebig viele ae-, oe- und ue-Kombinationen entstehen, die nicht umgewandelt werden dürfen. Und es dürfte auch genügend Zweifelsfälle geben, in denen ein Wort sowohl in der Umlaut-Schreibweise als auch in der xe-Variante gültig ist - und deshalb nicht umgewandelt werden kann, solange dein Programm den Wortsinn nicht versteht. Und zu allem Überfluss kommen dann noch die Fremdworte hinzu, die sich in jedem Text verstecken.
Mit anderen Worten: Es dürfte relativ unmöglich sein, dein Vorhaben in die Tat umzusetzen. Das beste ist immer noch, die Texte gleich mit Umlauten einzutippen.
- Sven Rautenberg
Moin, Sven,
Gib's auf!
ooch, dabei wäre das doch eine spannende Aufgabe von rein akademischem Wert - gerade für einen genialen Programmierer wie Dich! ;-)
Das beste ist immer noch, die Texte gleich mit Umlauten einzutippen.
Dann habe ich jetzt endlich eine Beschäftigung für Krisenzeiten! ;-)
Grüße,
Sebastian
Moin!
Moin Moin !
ich möchte gerne Texte, die ohne deutsche Umlaute - also mit "ae", "oe", "ue", "ss" - gespeichert sind, in die heute auch im Netz übliche Schreibweise zurückverwandeln.
[...]
Mit anderen Worten: Es dürfte relativ unmöglich sein, dein Vorhaben in die Tat umzusetzen. Das beste ist immer noch, die Texte gleich mit Umlauten einzutippen.
- Sven Rautenberg
Der Standard-Ansatz bei uns in der Firma: Praktikant einstellen und abtippen lassen!
A************ F**********
Hi,
ich möchte gerne Texte, die ohne deutsche Umlaute - also mit "ae", "oe", "ue", "ss" - gespeichert sind, in die heute auch im Netz übliche Schreibweise zurückverwandeln.
Hast Du es schon mal mit Word probiert?
Also wenn es reine Texte sind: in Word öffnen und die Rechtschreibprüfung (natürlich mit den alten Regeln) drüber jagen. Wenn nicht so aufgefallene Fachbegriffe vorkommen, sollte das einigermaßen schnell laufen.
Grüße,
Ronny
PS: Natürlich ist das auch mit Produkten, die nicht aus dem Hause MS kommen möglich.