Kann man nicht je Suchbegriff eine Liste (@Array) aufbauen und diese dann jeweils nach der Mengenlehre verarbeiten.
Ja, aber definiere das mal fertig, inklusive relativen Prioritäten für alle Operatoren und Klammernstrukturen. Irgendwann wird es heftig rekursiv.
Der + Operator macht aber nur bei einer OR-Verknüpfung Sinn.
Eben, und die hatte ich bisher nicht vor.
Dazu müsste das Leerzeichen aber als OR-Verknüpfung interpretiert werden und nicht als AND.
Die Syntax der Operatoren hat doch nichts mit ihrer Semantik zu tun?
Für den Near-Operator müsste in jedem Eintrag jeweils eine Datenstruktur enthalten sein, die sowohl das Dokument und die Position des Suchbegriffs vom Textanfang (ermittelt über die Funktion index() ) enthält. Daraus lässt sich die relative Nähe ermitteln.
Und zwar wie? Eine exakte Formel wäre hilfreich. Abstand in Bytes? Reihenfolge? Es tendiert dazu, uferlos und hochwissenschaftlich zu werden ... vor allem irrelevant für viele Anwender, denke ich.
Damit das Ganze richtig schnell wird könnte es sinnvoll sein, Indexdateien zu erzeugen, auf die dann für die Suche zugegriffen wird.
Das ist bereits der Fall - das Skript durchsucht nicht etwa die einzelnen Posting-Dateien!
Hoffentlich rauben Dir meine Vorstellungen nicht gleich den Mut. Sie sind _wirklich_ nur als Diskusionsbeiträge gedacht und könen natürlich auch ignoriert werden.
Keineswegs - und vielleicht baut ja auch erst mein Nachfolger volle expressions ein ... mein Ziel ist ein anderes.