Automatische Silbentrennung
nam
- javascript
Hallo und guten Tag!
Weil es bisher keine clientseitige Silbentrennung gibt, habe ich eine in JavaScript implementiert. Das Script liegt auf http://www.mnn.ch/hyph/orig/dehyph_v1.js
Einen Artikel mit Infos zum Thema liegt auf http://www.mnn.ch/hyph/silbentrennung1.html (in diesem Artikel ist die Silbentrennung aktiviert, funktioniert aber in Firefox nicht).
Was hält ihr davon?
(Bin ziemlich stolz darauf und trage die Nase etwas hoch im Moment. Brauche deshalb Kritik ;-)
Gruss aus Zürich,
Mathias
Hallo
Also das Ding sieht zunächst einmal von der Beschreibung recht interessant aus und ich denke mal drüber nach es auszuprobieren. Allerdings würde ich mal folgende Optimierung andenken. Diese basiert auf der Aussage:
Bei seinen Tests stellte sich heraus, dass mit nur knapp 5000 Mustern beinahe 90% aller Trennstellen gefunden werden konnten. Um aber alle Trennstellen zu finden waren an die 20'000 Muster nötig – zuviel für damalige Rechner.
Also angenommen ich habe eine Webseite. Diese hat in der Regel einen kompakten Wortschatz. Die einen befassen sich mit HTML, die anderen mit Webdesign und wieder andere stellen eine Detektei vor.
Wie sieht es eigentlich aus, wenn man nur die Muster mitliefert, die man konkret braucht?
Herzliche Grüße
Wolfgang
Wie sieht es eigentlich aus, wenn man nur die Muster mitliefert, die man konkret braucht?
Hallo Wolfgang
Das ist eine sehr interessante Idee. So könnte man wohl ein paar KB sparen und die Suche beschleunigen.
Serverseitig ist dann eine Art Präprozessor nötig, der das Muster vorbereitet und passend zur Seite ausliefert...
Danke für den Tip!
Es grüsst Mathias
Hallo Mathias
Es geht sogar noch einfacher: Nehmen wir den folgenden Satz:
Dieser Artikel behandelt im ersten Teil die Problematik
Getrennt:
Die-ser Ar-ti-kel be-han-delt im er-sten Teil die Pro-ble-ma-tik
Dem gibt man bereits mit
"3 22 23 0 2 0 0 332"
Das erste Wort wird nach 3 Buchstaben getrennt, das zweite nach 2 und noch einmal nach 2 usw. Einen Zahlentrenner braucht man nicht. Und wenn eine Silbe länger ist als 9 Zeichen, dann muss man ein A, B, C usw. schicken.
Und wenn man weiter nachdenkt, fällt einem bestimmt noch eine Kompression ein.
Herzliche Grüße
Wolfgang
Guten Abend Wolfgang
Deine Überlegungen habe ich mir nochmals durch den Kopf gehen lassen und habe mich entschieden, eine serverseitige Zuschneidung der Patternliste auszuschliessen, weil:
Ausserdem ist durch ein "allgemeines" Script auch die Umsetzung als Bookmarklet möglich.
Gruss,
Mathias