Suchmaschine, die reguläre Ausdrücke verarbeitet
gernotback
- regex
- suchmaschinen
Hallo an alle (mal wieder nach langer Zeit),
da ich mich in den letzten Jahren eher in liguistischen Fachforen tummele, bin ich immer mal wieder auf der Suche nach Belegen für einen bestimmten (oft sonderbaren) Sprachgebrauch.
Aktuell sind das Begleitsätze zu direkter Rede, die gar kein richtiges verbum dicendi, wie »sagen«, »erklären«, »behaupten«, »rufen« etc. enthalten.
Beispiele:
„Auch Lebensmittel werden immer öfter über das Internet und das Handy gekauft“, ist sich Vereins-Obmann Rupert Wiesinger bewusst.
„Besonders tragisch ist der vorliegende Vorgang, da auch ein Jugendlicher betroffen ist“, bedauert Verbands-Justitiar Rainer auf der Straße.
Ich suche also im Internet nach Textbelegen, bei denen ‒ wie beim ersten Beispiel ‒ auf eine durch öffnende und schließende Anführungszeichen markierte direkte Rede mit Komma abgetrennt ein Begleitsatz folgt, der mit dem Verb »sein« in der 3. Person beginnt und mit »sicher« oder »bewusst« endet oder nach einem weiteren Komma mit der Fortführung der durch Anführungszeichen markierten direkten Rede weitergeht.
Oder ich suche Belege, bei denen auf die direkte Rede ‒ wie im zweiten Beispiel ‒ ein Komma und entweder das Verb »sich freuen« oder das Verb »bedauern« in der dritten Person (egal in welchem Numerus, Tempus oder Modus) gefolgt von einem Subjekt (z. B. Titel oder Anrede + Name[n]) steht.
Die von Google zur Verfügung gestellten Suchausdrücke sind da wenig präzise: Sonderzeichen wie Anführungszeichen und Kommas berücksichtigt Google genauso wenig wie die Groß- und Kleinschreibung.
Mit "ist sich * * (sicher|bewusst)" als Google Suchanfrage finde ich zwar einiges, wie etwa
„Popstar Madonna war im Juni an einer Sepsis erkrankt“, ist sich der Mediziner sicher.
oder
„Der Rest kommt dann von alleine“, ist sich der Trainer sicher.
Die meisten Treffer haben aber mit Begleitsätzen zu direkter Rede nichts zu tun, wie z. B.:
China sitzt auf wertvollen Rohstoffen – und ist sich dieser Macht bewusst.
Kennt jemand eine Suchmaschine, die Textretrieval besser kann als Google und dabei ein möglichst komplettes Repertoire an regulären Ausdrücken zulässt?
@@gernotback
Hallo an alle (mal wieder nach langer Zeit),
Gernot is back!
Das konnte ich mir jetzt angesichts
für einen bestimmten (oft sonderbaren) Sprachgebrauch.
nicht verkneifen.
🖖 Живіть довго і процвітайте
Hi Gernot,
ich würde mich mal mit dem Funktionsumfang der erweiterten Suchen von unterschiedlichen Nationalbibltiotheken beschäftigen.
Das einzige Tool, über welches ich bisher gestolpert bin, das ziemlich genau das bieten könnte was du benötigst findest du hier.
Sketch Engine is the ultimate tool to explore how language works. Its algorithms analyze authentic texts of billions of words (text corpora) to identify instantly what is typical in language and what is rare, unusual or emerging usage. It is also designed for text analysis or text mining applications.
Sketch Engine is used by linguists, lexicographers, translators, students and teachers. It is a first choice solution for publishers, universities, translation agencies and national language institutes throughout the world.
Scheint so als gäbe es eine 30-Tage Freeversion und dann kostet es etwas. Ich bin übrigens kein Vertreter von denen, finde das Ding aber auch interessant. Probiert habe ich es noch nicht.
Unter CQL ist hier übrigens "Corpus Query Language" zu verstehen (siehe Cambridge).
Unter CQL ist hier übrigens "Corpus Query Language" zu verstehen (siehe Cambridge).
Jaaa :D Das kenn ich auch noch, mega.
Hallo Suchfux,
vielen Dank für die Hinweise, die klingen vielversprechend, ich werde mich am Wochenende mal damit beschäftigen.
Beste Grüße
Gernot