gudn tach!
(bevor ich's wieder vergesse: achte bitte darauf, dass du nicht die hier uebliche zitierweise zerstoerst.)
ich sehe darin auch kein didaktisches problem.
Doch das ist es. Denselben Begriff für ein syntaktisches Element und für eine logische Sicht auf die Dinge zu verwenden kann tödlich sein.
wie gesagt verstehe ich "subpattern" bei regexps analog zu "term" bei formeln.
in der formel
a+b(c-d)
ist (c-d) sowohl einfach erst mal ein term, als auch ein multiplikativer term (ok, mit der zusaetzlichen bezeichnung "faktor", aber die ist hier gar nicht noetig).
die strikte trennung, die du versuchst durch zwei verschiedene begriffe zu erreichen, ist imho eher verkomplizierend als erleichternd; zumal die begriffe "unter-" und "teil-" so stark synonym sind (vgl. "teilmenge" vs. "untermenge", beides bezeichnet dasselbe), dass man sie sehr leicht durcheinanderwuerfeln wuerde und somit staendig nachschauen muesste, was davon jetzt noch mal was waere.
Also – momentan ist es so, dass ich ein Kapitel Syntax habe, wo ich eben die Syntax übersichtartig darstelle und die Begrifflichkeiten vorstelle und definiere. Durchaus mit Hinweisen auf die Abweichungen zur üblichen Terminologie.
ja, sowas finde ich wichtig. dein buch wird vermutlich nicht das einzige sein, was jemand zu regexp liest.
Und ein weiteres großes, großes Problem ist es eine einheitliche Linie zu fahren. Beispielsweise mische ich ja bei "positiver Lookahead" englisch und deutsch. Ich habe keine Probleme damit, aber eigentlich müsste ich, wenn schon, denn schon schreiben "positive Lookahead" oder wenn schon, denn schon "positive lookahead" oder "positive look-ahead" oder was? Es ist ja beileibe nicht so, dass die englische Schreibweise bei den Begrifflichkeiten einheitlich ist, da geht's drunter und drüber.
jein. es gibt da schon richtlinien. "look-ahead" wuerde man im englischen afaik nicht zusammenschreiben. beim eindeutschen jedoch darf man einiges aendern am urspruenglichen wort.
Beispiel:
Und nach dem positive look-ahead kommt ein non-capturing subpattern, das dann bei unseren backreferences nicht mitzählt ...
Und nach dem positiven Lookahead kommt ein Bereichsmuster, das dann bei unseren Rückwärtsreferenzen nicht mitzählt ...Wenn ich das gegenüberstelle, finde ich das erste einfach grauenhaft, da würde ich ja lieber gleich komplet auf Englisch schreiben.
ja, komplett auf englisch ist natuerlich auch ne moeglichkeit. aber mir gefaellt der erste satz viel besser als der zweite und ich kann ihn fluessiger lesen - vor allem wegen dem fuer mich ungewohnten "bereichsmuster", was ich jetzt uebrigens schon wieder haette nachschlagen muessen, wenn nicht im satz vorher gestanden haette, dass es sich um non-capturing subpattern handelt. ;-)
Was ich mir vorstellen könnte wäre, dass man die Begriffe quasi halb eindeutscht. Mit Großschreibung und Bindestrichen finde ich das lesbar.
ja, so wird es afaik auch z.b. von der duden-redaktion empfohlen.
Und nach dem positiven Lookahead kommt ein Non-Capturing-Subpattern, das dann bei unseren Backreferences nicht mitzählt ...
Das gefällt mir gar nicht mal schlecht,
als grosser kleinschreibungsfan kann ich da dazu wohl nichts unvoreingenommenes sagen. ich finde das erste beispiel nicht schlechter als dieses dritte. ;-)
aber ok, ich wuerde an deiner stelle wohl auch die dritte variante praeferieren.
aber ob das dann für alle Begrifflichkeiten so wirklich hinhaut kann ich jetzt nicht sagen.
ich denke schon.
Quantifier
das waere evtl. mal ein begriff, bei dem das deutsche "quantor" evtl. angebracht waere, weil es zumindest in der mathematik, aber auch haeufig in der informatik, gebraeuchlich ist. es ist zudem kuerzer als das englische pendant und trotzdem aehnlich genug.
"rangepattern" vs. "subpattern" gefaellt mir persoenlich gar nicht.
"rangepattern" gefällt mir auch überhaupt nicht, mit "Bereichsmuster" habe ich dagegen überhaupt kein Problem. Ich glaube, die subjektive Gewöhnung an einen Begriff spielt eine viel größere Rolle als wir denken.
das glaube ich nicht. also versteh' mich nicht falsch. ich bin der meinung, dass die gewoehnung eine enorm grosse - um nicht zu sagen: die wesentliche - rolle spielt. das heisst, ich unterschaetze sie bestimmt nicht. mit "gefaellt mir nicht" meinte ich, dass mir "range-" bzw. "bereichs-" im ggs. zu "sub-" der didaktische gedanke verloren geht.
man muss bei dir, wenn ich's richtig verstanden habe, hart zwischen bereichs-, teil- und sub- bzw. unterpattern unterscheiden, obwohl es sich eigentlich erstmal jeweils um einen teilbereich(!) eines regexp handelt. diesen verschiedenen begriffen ist teilweise schon ein zweck inherent, obwohl der gar nicht unbedingt gegeben sein muss.
also ich finde, insg. wird die sache dadurch wesentlich komplizierter.
neben der ueberlegung, was man alles substantivisch (statt attributiv) unterscheiden _kann_, sollte man bei der begrifflichkeit auch beruecksichtigt werden, wie eine regexp-engine "denkt". denn wenn man das halbwegs verstanden hat, dann kommt man auch besser mit regexps klar.
eine regexp-engine parst einen regexp mehr oder weniger von links nach rechts und kuemmert sich nicht darum, ob eine klammer jetzt erstmal nur der gruppierung oder des zwischenspeicherns dient.
prost
seth