Stefan Muenz: (ZU DIESEM FORUM) (ARCHIV) Neue Suchfunktion: Freigabe zum Anwendertest

Beitrag lesen

Hallo Michael

Dieses Skript war nämlich ganz nebenbei ein ernsthafter Test dafür, wie sehr Du bereit bist, "loszulassen" und SELFAKTUELL zu dem kooperativen Internet-Technologie-Portal werden zu lassen, das in http://www.teamone.de/selfaktuell/version.htm angedacht ist ...

Auweia, da hab ich aber Glueck gehabt <g>.
Auch wenn "Loslassen" nicht gerade meine Paradedisziplin ist, bin ich eigentlich sehr dankbar, wenn mir Leute hier auch mal Arbeit abnehmen. Ich bin halt nur immer etwas vorsichtig, weil es haeufig von Geltungsdrang zerfressene Windbeutel sind, die mir ihre Dienste anbieten. Da bin ich mir bei Leuten wie dir oder Frank natuerlich sicher, dass ich auf der richtigen Seite bin.

Ein Beispiel alleine reicht mir aber nicht aus. Okay: ü -> (üue) kriege ich hin. Was noch alles?
(Auch ue -> (üue), beispielsweise?)

eigentlich nur die Umlaute und scharfes S:
Eingabe "ae" sollte sowohl "ae" als auch "ä" finden wenn gewuenscht (Checkbox)
"oe" -> "oe" und "ö"
"ue" -> "ue" und "ü"
"Ae" -> "Ae" und "Ä"
"Oe" -> "Oe" und "Ö"
"Ue" -> "Ue" und "Ü"
"ss" -> "ss" und "ß"
Umgekehrt ist problematisch und sollte weggelassen werden. Denn Eingabe "ä", die auch alle "ae" findet, macht meines Erachtens keinen Sinn, da "ae" auch was anderes als die Umschreibung eines Umlauts sein kann.

Hm. da muß ich jetzt raten, was genau Du meinst. Insbesondere das abschließende ">" von "<frame>" paßt da natürlich nicht ins Konzept.

Eben. Es wird von der normalen Suche nicht gefunden - nur eine "mitdenkende" Suche koennte erkennen, dass der User das HTML-Tag meint. Die Suche muesste also gewissermassen selbstaendig den vom User eingegebenen Suchausdruck interpretieren und das Pattern-Matching intern anpassen. Ich denke jedenfalls, in dem inhaltlichen Kontext, in dem wir uns hier bewegen, darf man < und > im Suchausdruck als Wunsch nach Finden eines HTML-Tags interpretieren. Diese Art von "intelligentem" Anpassen des eigentlichen Pattern-Matchings in Bezug auf HTML sollte natuerlich ein-/ausschaltbar sein (Checkbox).

Dass ein erfahrener User all das auch durch regulaere Ausdruecke erschlagen kann, ist klar. Aber denkt immer dran, dass die Mehrzahl der User, die dieses Suchformular benutzen, eben keinen blassen Schimmer von RE haben.

Das ist letztlich das umgekehrte Problem dazu, daß ich bei "Schröpl" im Archiv weiterhin null Treffer habe. Denn das Such-Skript codiert das "ö" nach HTML um - das Posting-Skript offenbar nicht ... hier müssen sich beide an dieselben Spielregeln halten.

In der Suchindexdatei stehen Umlaute ganz normal drin - die Suchindexdatei ist also gewissermassen eine iso-8559-1-Datei. Nur die HTML-eigenen Zeichen < und > werden, wie schon oben erwaehnt, maskiert. Insofern sollte eine Suche nach ö auch Treffer mit ö bringen. Frank hat mich seinerzeit lange genervt deswegen, schliesslich hat er ja auch ein ö im Namen und wollte sich gern mal finden <g>.

Hm, das ist HTML, da kenne ich mich nicht so aus. ;-)

Einfach <form ... method="get">
Und fuer die Weiterverarbeitung in Perl siehe <selfhtml/tgbf.htm#a1>. So weit ich weiss, nutzt ihr die cgi.pm zjm Formularparsen. Ich weiss nicht, ob die beide Methoden unterstuetzt.

viele Gruesse
  Stefan Muenz