Michael Schröpl: (ZU DIESEM FORUM) (ARCHIV) Neue Suchfunktion: Freigabe zum Anwendertest

Beitrag lesen

ach, macht das Spass, mal "Verbesserungsvorschlaege" machen zu duerfen <g>):

Das hast Du Dir verdient!
Dieses Skript war nämlich ganz nebenbei ein ernsthafter Test dafür, wie sehr Du bereit bist, "loszulassen" und SELFAKTUELL zu dem kooperativen Internet-Technologie-Portal werden zu lassen, das in http://www.teamone.de/selfaktuell/version.htm angedacht ist ...

  1. die "intelligente" Variantensuche fuer Umlaute und scharfes s. Also dass er sowohl Münzen also auch Muenzen findet <g> bzw. eine Checkbox hat, wo man diese Variantensuche ein-/ausstellen kann.

Kein Problem, wenn genau definiert ist, was wie zu ersetzen ist. Es sollte nicht schwerer sein als das "escapen" der regular-expression-Metazeichen (und *das* war für Frank ein Einzeiler ;-).
Ein Beispiel alleine reicht mir aber nicht aus. Okay: ü -> (üue) kriege ich hin. Was noch alles?
(Auch ue -> (üue), beispielsweise?)

In jedem Falle wäre die Änderung weitgehend isoliert im Tokenizer-Komplex, und es wären dort auch nur ein paar zusätzliche s/.../-Zeilen und die Abfrage eines zusätzlichen Formular-Flags. Also: machbar.

  1. die ausdrueckliche Suche nach Sprachbefehlen. In der Suchindexdatei stehen im Nachrichtentext beispielsweise Dinge wie:
    <frame name=verweise src=verweise.htm>
    Waere doch schoen, wenn der User jetzt einfach im Suchfeld <frame> oder <frame src=> eingeben kann, und so etwas wuerde gefunden!

Hm. da muß ich jetzt raten, was genau Du meinst. Insbesondere das abschließende ">" von "<frame>" paßt da natürlich nicht ins Konzept.

Ansonsten: Nach "frame" kann man ja bereits suchen.
Nach "<frame" auch - leider gibt das dann Null Treffer. Warum? Weil die Codierung des "<"-Zeichens zwischen Posting-Skript und Such-Skript unterschiedlich zu sein scheint. Was genau schreibt denn das Posting-Skript ins Archiv?
Ich vermute, es reicht schon aus, das "<"-Zeichen genau wie die Umlaute in der Sucheingabe nach HTML zu konvertieren - das wäre eine Kleinigkeit
(eine Zeile mehr pro umzusetzendes Zeichen).

Das ist letztlich das umgekehrte Problem dazu, daß ich bei "Schröpl" im Archiv weiterhin null Treffer habe. Denn das Such-Skript codiert das "ö" nach HTML um - das Posting-Skript offenbar nicht ... hier müssen sich beide an dieselben Spielregeln halten. (Und außerdem müßte man mal schnell mit Perl über den Archiv-Index drüberfahren, um diesen ebenfalls "gleichzuschalten".)
Also? Das Problem ist nicht isoliert lösbar ...

  1. Da die Formulardaten ja nicht so umfangreich sind, koennte man sie nicht auch mit GET auswerten? Der Vorteil waere, dass dann bei der Suchtrefferausgabe das Zustandekommen des Ergebnisses in der URL-Zeile stehen wuerde. Dies koennte man wiederum rauskopieren und hier im Forum als "langen Link" bei der Beantwortung von Fragen anbieten. Denn manchmal reicht die einfache Form wie /cgi-local/sfasuch.pl?ASP einfach nicht.

Hm, das ist HTML, da kenne ich mich nicht so aus. ;-)
Ganz ehrlich: Deine Eingabeschnittstelle für das Suchskript habe ich mit ganz spitzen Fingern angefaßt, weil ich nicht einschätzen konnte, welche verborgenen Abhängigkeiten (zu Datenbeständen des Forums etc.) damit verbunden sind. Die "Integration des Gesamtkunstwerkes" kann außer Dir derzeit niemand machen.

Der von Cheatah immer wieder gepostete Zweizeiler für die Analyse der CGI-Parameter würde das Skript möglicherweise um 30 Zeilen verkürzen.
Das kann man aber jederzeit problemlos nachrüsten, weil es mit der Logik der Sucherei ja nun überhaupt nichts zu tun hat ... je modularer das Skript ist, desto leichter kann man lokale Änderungen mit geringem Risiko einbauen.