Beat: Suchfunktion bewerten

Hallo

In meinem eHomeFactory CMS ist nun eine Suchfunktion entwickelt worden.

Die Suche hat mehrere Aspekte:

  • globales Suchfeld
  • Seite für explizite Suche
  • SERP
  • Location-Bar im Browser.

Zu Bewerten steht die Usability. (Formular und Locationbar)
Semantik (Test ohne CSS).

Damit ihr nicht im trüben fischt
gute Suchstichworte sind
"Perl", "Angebot", "CSS", "Design"

http://www.elcappuccino.ch/ehome-factory/search?q=perl

Entschuldigung jenen, die ihren UA-String sehr schräg definieren.

mfg Beat

--
><o(((°>           ><o(((°>
   <°)))o><                     ><o(((°>o
Der Valigator leibt diese Fische
  1. Hallo!

    Mal ein paar ungefilterte und unsortierte Eindrücke: um was geht's hier überhaupt? Oben sind übereinander geschichtet mehrere Begriffe wie "eHome Factory", "Trau Dich" oder "asphalt" zu erraten. Aha! Egal, es ging um die Suchfunktion. Also wo geht es zur Suchfunktion? Ah, in dem blauen Balken ist das blaue Eingabefeld versteckt! Und eine Erklärung steht auch darunter. Was ist jetzt bloß eine ODER-Verknüpfung? Und wie macht man eine UND-Verknüfung? Also mal "perl" eingeben... 1. Ergebnis: "4.8 Perl". Was bedeutet 4.8? Scheint wegen der blauen Hervorhebung jedenfalls wichtig zu sein. Eine Kapitelangabe?

    Tommi

    1. Ergebnis: "4.8 Perl". Was bedeutet 4.8? Scheint wegen der blauen Hervorhebung jedenfalls wichtig zu sein. Eine Kapitelangabe?

      Es ist eine Gewichtung des Suchergebnisses. Werte über 1 haben eine gewisse Relevanz.
      Eine Alternative wäre gewesen, mit Sternen zu arbeiten.
      Aber richtig. Da gehört noch ein title Attribut dazu.

      mfg Beat

      --
      ><o(((°>           ><o(((°>
         <°)))o><                     ><o(((°>o
      Der Valigator leibt diese Fische
      1. Es ist eine Gewichtung des Suchergebnisses.

        Was interessiert mich das als Benutzer? Ich würde einfach nur erwarten, dass das erste Ergebnis das relevanteste ist.

        Und nochmal zu der ODER-Verknüpfung. Ich glaube, spätestens seit Google der Inbegriff für "Suche" ist, erwartet man, dass in den Ergebnissen alle Wörter vorkommen.

        Tommi

        1. Es ist eine Gewichtung des Suchergebnisses.
          Was interessiert mich das als Benutzer? Ich würde einfach nur erwarten, dass das erste Ergebnis das relevanteste ist.

          Die Gewichtung MUSS dich ja nicht interessieren.
          Aber wenn du fünf Resultete erhältst mit den gewichten 6.4, 6.2, 0.1, 0.1, 0.1
          weisst du, dass dich die letzten drei nicht zu interessieren brauchen.

          Und nochmal zu der ODER-Verknüpfung. Ich glaube, spätestens seit Google der Inbegriff für "Suche" ist, erwartet man, dass in den Ergebnissen alle Wörter vorkommen.

          Das ist berechtigt für Google. Aber Site-Search hat ein anderes Volumen und eine andere Aufgabe.
          Eine einzelne HP beinhaltet selten so viele Texte, dass die Suche AND Verknüpfungen ausschliesslich erfolgreich berichten kann.
          Den Suchenden frustriert es eher, wenn er nichts findet, als dass er zuviel findet.

          Man kann natürlich Resultate höher gewichten, in welchen jedes Wort mindestens einmal vorkommt.

          mfg Beat

          --
          ><o(((°>           ><o(((°>
             <°)))o><                     ><o(((°>o
          Der Valigator leibt diese Fische
          1. Hallo Beat!

            Die Gewichtung MUSS dich ja nicht interessieren.
            Aber wenn du fünf Resultete erhältst mit den gewichten 6.4, 6.2, 0.1, 0.1, 0.1

            Warum nicht Prozent-Angaben? Man mag sie mögen oder nicht, aber diese sind so verbreitet..., dass sicher Otto-Normal-Surfer sie versteht... [1]

            [1] Sein Bruder, Klaus-Dieter-Gelegentlich-Surfer, würde weder die Prozente noch die Punkte verstehen.

            Viele Grüße aus Frankfurt/Main,
            Patrick

            --
            _ - jenseits vom delirium - _

               Diblom   [link:hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash]
            J'ai 10 ans! | Achtung Agentur! | Nichts ist unmöglich? Doch! | Heute schon gegökt?
            1. Warum nicht Prozent-Angaben?

              Ich muss jetzt überlegen, Prozente von was?
              Nehme ich die Gesamtmatches aller Seiten als 100% so hat eine einzige lausige gefundene Seite 100% und eine einzige sehr gute gefundene Seite 100% aber eine gute relevante Seite unter 20 Mitbewerbern nur 30%.
              Das verstehe, wer will...

              Man mag sie mögen oder nicht, aber diese sind so verbreitet..., dass sicher Otto-Normal-Surfer sie versteht... [1]
              [1] Sein Bruder, Klaus-Dieter-Gelegentlich-Surfer, würde weder die Prozente noch die Punkte verstehen.

              Wenn auf dem Bildschirm nur das stehen darf, was eine ausgesuchte Mehrheit ohne Nachdenken versteht, reicht wohl 42 (mit einer kurzen Erklärung)

              mfg Beat

              --
              ><o(((°>           ><o(((°>
                 <°)))o><                     ><o(((°>o
              Der Valigator leibt diese Fische
          2. Den Suchenden frustriert es eher, wenn er nichts findet, als dass er zuviel findet.

            Also mich würde es definitiv mehr frustrieren, wenn ich Ergebnisse angezeigt bekommen würde, die nicht enthalten, wonach ich gesucht habe.

            Man kann natürlich Resultate höher gewichten, in welchen jedes Wort mindestens einmal vorkommt.

            Oder einen zweiten Suchdurchlauf starten, wenn die AND-Verknüpfung nichts gefunden hat. Dann aber bitte einen entsprechenden Hinweis anbringen ("Es wurde keine Seite gefunden, die alle Stichworte enthält...").

            Tommi

          3. Aber wenn du fünf Resultete erhältst mit den gewichten 6.4, 6.2, 0.1, 0.1, 0.1
            weisst du, dass dich die letzten drei nicht zu interessieren brauchen.

            Warum werden sie dann überhaupt angezeigt?

            1. Aber wenn du fünf Resultete erhältst mit den gewichten 6.4, 6.2, 0.1, 0.1, 0.1
              weisst du, dass dich die letzten drei nicht zu interessieren brauchen.
              Warum werden sie dann überhaupt angezeigt?

              Weil in ihnen der Begriff gefunden wurde

              mfg Beat

              --
              ><o(((°>           ><o(((°>
                 <°)))o><                     ><o(((°>o
              Der Valigator leibt diese Fische
  2. Entschuldigung jenen, die ihren UA-String sehr schräg definieren.

    Wie verträgt sich das mit "Usability"?

    Tommi

    1. Entschuldigung jenen, die ihren UA-String sehr schräg definieren.
      Wie verträgt sich das mit "Usability"?

      Kommt auf die Anwendung an.
      Ich habe die Restriktion jetzt für dieses Script aufgehoben.

      mfg Beat

      --
      ><o(((°>           ><o(((°>
         <°)))o><                     ><o(((°>o
      Der Valigator leibt diese Fische
  3. hi,

    http://www.elcappuccino.ch/ehome-factory/search?q=perl

    Na endlich maln Bild von Dir :-)

    Ok, die Suche: +perl -text gibt bei dir weniger Treffer als +perl +text

    In meiner Suchmaschine ist das genau umgekehrt. Andere Philosophie?

    +perl +text
    +perl -text

    Ich verwende Perl::Text::Query

    Ansonsten hast Du das Suchergebnis sehr schön dargestellt.

    Hotti

    1. http://www.elcappuccino.ch/ehome-factory/search?q=perl

      Ok, die Suche: +perl -text gibt bei dir weniger Treffer als +perl +text
      In meiner Suchmaschine ist das genau umgekehrt. Andere Philosophie?

      Meine Wordchars sind [\w\p{L}-_]

      Das Plus ist ein Leerzeichen (Bezug zu Location Bar)
      Jedes andere Nonwordchar wird zu einem Leerzeichen konvertiert.
      Dieses Leereichen dient dann als OR-Operator.

      Mit -text suchst du also wörtlich nach "-text"
      Mit +perl suchs du aber nach "perl"

      Ich habe keine Verwendung dafür Begriffe auszuschliessen. Dafür ist das Textvolumen in einer Domain doch zu klein.

      Ich verwende Perl::Text::Query

      Meine Suche muss primär ausfiltern.
      striphtml und stripehfcode entfernen schon mal noise.
      &shy; werden entfernt

      Das sind da offene Fragen in Text::Query

      Offene Dinge sind auch Umlaute.
      Deutsche Suchen Rusz. Schweizer schreiben Russ. Bzw Umgekehrt.

      mfg Beat

      --
      ><o(((°>           ><o(((°>
         <°)))o><                     ><o(((°>o
      Der Valigator leibt diese Fische
      1. hi,

        Offene Dinge sind auch Umlaute.
        Deutsche Suchen Rusz. Schweizer schreiben Russ. Bzw Umgekehrt.

        http://rolfrost.de/cgi-bin/find.cgi?query=ru�&find=Suchen+und+Finden&mode=simple_text@Ruß

        => Rußheim (nicht weit vom Rhein). In meiner Suchmaschine kannst Du auch nach öl suchen.

        Das ist nurne Frage der Zeichenkodierung, nicht jedoch eine Frage des Perl-Moduls Text::Query, was auch die Anzahl der Matches ermittelt (eine Möglichkeit Relevanz einzubauen).

        Viele Grüße,
        Rolf

        PS

  4. 'ǝɯɐu$ ıɥ

    Entschuldigung jenen, die ihren UA-String sehr schräg definieren.

    Erkläre Er sich...heißt das meinereiner als Bundestrojaner getarnt nicht auf deine Webseite darf, warum? Keiner mag mich *soifz*.

    ;-)

    ssnɹƃ
    ʍopɐɥs

    --
    LORD OF THE RINGS: Midget destroys stolen property.
    1. Entschuldigung jenen, die ihren UA-String sehr schräg definieren.
      Erkläre Er sich...heißt das meinereiner als Bundestrojaner getarnt nicht auf deine Webseite darf, warum? Keiner mag mich *soifz*.

      Log: Bundestrojaner/4.2
      Ist der denn schon durch die Umweltverträglichkeitsprüfung?

      mfg Beat

      --
      ><o(((°>           ><o(((°>
         <°)))o><                     ><o(((°>o
      Der Valigator leibt diese Fische
      1. 'ǝɯɐu$ ıɥ

        Entschuldigung jenen, die ihren UA-String sehr schräg definieren.
        Erkläre Er sich...heißt das meinereiner als Bundestrojaner getarnt nicht auf deine Webseite darf, warum? Keiner mag mich *soifz*.

        Log: Bundestrojaner/4.2
        Ist der denn schon durch die Umweltverträglichkeitsprüfung?

        sicher dat, wenn man trojaner richtig ernährt sind die abgase absolut umweltverträglich (meiner hat das "Rafflesia spec. Siegel am Olifaktorischen Würgeband) , der duft wird immer mit dem wohlgeruch versch. in pflanzen in verbindung gebracht z.b.: Ferula assa-foetida, Dracunculus vulgaris, Escallonia viscosa und so weiter...

        hehe

        ssnɹƃ
        ʍopɐɥs

        --
        In a perfect world, spammers would get caught, go to jail,
        and share a cell with many men who have enlarged their penisses,
        taken Viagra and are looking for a new relationship.
  5. Hallo Beat!

    In meinem eHomeFactory CMS ist nun eine Suchfunktion entwickelt worden.

    Nachfolgend einige Anmerkungen zu deiner Suchfunktion, die rein auf meinen Versuchen & Experimenten damit fußen.

    Zunächst einmal sollte man imho berücksichtigen, dass die Gründe, warum und wofür ein User eine Suchfunktion benutzt, genauso unterschiedlich sind, wie die User und ihr jeweiliger Kenntnisstand selber.

    Schon alleine deswegen sollte man imo eine Suchfunktion so "flexibel" wie nur irgendmöglich gestalten, d.h. eine "Standard-Suche" (mit den wohl am häufigsten gewünschten Einstellungen) und darüber hinaus eine "erweiterte Suche", die sich möglichst präzise an die jeweiligen Userwünsche anpassen lässt.

    Soweit ich das beobachten konnte, handelt es sich bei deiner SF um eine Volltextsuche, die auch nur Wortbestandteile findet.
    Also liefert mir bspw. eine Suche nach "Perle" auch alle Einträge mit dem Wort "Perl". Über die Relevanz braucht man da glaube ich nicht mehr viel sagen.

    Über die Anzeige der Relevanz ist ja hier schon einiges geschrieben worden. Trotzdem auch von mir noch ein paar Anmerkungen:
    Da es sich bei dem zugrundeliegenden Script ja um ein CMS handelt, würde ich erwarten, dass sich die Relevanz auf den gefundenen Beitrag bezieht. Und zwar z.B. in Form von Tags (und deren Gewichtung für den jeweiligen Beitrag).
    Dass die Sortierung der Suchergebnisse standardmäßig absteigend nach Relevanz erfolgt, dürfte wohl die natürliche Erwartungshaltung der allermeisten Besucher sein. Aber wenn schon eine extra Anzeige der Relevanz, dann bitte auch eine nachvollziehbare. Ich dachte zuerst, dass das Maximum bei 5.0 liegen würde, bis ich dann ein Suchergebnis mit 5.2 erhielt.

    Gänzlich "unbrauchbar" wird so eine Relevanzanzeige, wenn du so allgemeine Suchbegriffe wie "und" zulässt. Hier bedarf es imho einer Liste mit Wörtern, die zumindest bei einer Volltextsuche ausgeschlossen werden.

    Fazit:
    Gerade bei einem CMS sollte eine Suchfunktion möglichst vielseitig sein (ODER und UND Verknüpfungen, Volltextsuche oder nur ganze Wörter, nach Themen und/ oder Schlagwörtern suchen, etc. pp).

    Gruß Gunther

    1. In meinem eHomeFactory CMS ist nun eine Suchfunktion entwickelt worden.
      Nachfolgend einige Anmerkungen zu deiner Suchfunktion, die rein auf meinen Versuchen & Experimenten damit fußen.

      Zunächst einmal sollte man imho berücksichtigen, dass die Gründe, warum und wofür ein User eine Suchfunktion benutzt, genauso unterschiedlich sind, wie die User und ihr jeweiliger Kenntnisstand selber.

      OK. Auch und gerade Designer sind oft Betriebsblind...

      Schon alleine deswegen sollte man imo eine Suchfunktion so "flexibel" wie nur irgendmöglich gestalten, d.h. eine "Standard-Suche" (mit den wohl am häufigsten gewünschten Einstellungen) und darüber hinaus eine "erweiterte Suche", die sich möglichst präzise an die jeweiligen Userwünsche anpassen lässt.

      OK: Optionen in einer Klappbox.

      Welche Optionen gibt es?

      Soweit ich das beobachten konnte, handelt es sich bei deiner SF um eine Volltextsuche, die auch nur Wortbestandteile findet.

      Ja. HTML und EHF-Code wird weggefiltert. Leider werden dadurch Fussnotentexte nicht gefunden.

      Also liefert mir bspw. eine Suche nach "Perle" auch alle Einträge mit dem Wort "Perl". Über die Relevanz braucht man da glaube ich nicht mehr viel sagen.

      Ich weiss ja nicht wo du suchst. Aber
      http://www.elcappuccino.ch/ehome-factory/search?q=Perle
      findet, was ich erwarte:Nichts.
      Als Admin kann ich die meisten Files duchsuchen.
      Deshalb: Was hast du gemacht, dass du zu einem anderen Resultat gelangst?

      Über die Anzeige der Relevanz ist ja hier schon einiges geschrieben worden. Trotzdem auch von mir noch ein paar Anmerkungen:
      Da es sich bei dem zugrundeliegenden Script ja um ein CMS handelt, würde ich erwarten, dass sich die Relevanz auf den gefundenen Beitrag bezieht. Und zwar z.B. in Form von Tags (und deren Gewichtung für den jeweiligen Beitrag).

      Also die Gewichtung ist, wie bei Google Magic. Ich muss da noch erfahrung sammeln, was wohl richtig ist.

      Dass die Sortierung der Suchergebnisse standardmäßig absteigend nach Relevanz erfolgt, dürfte wohl die natürliche Erwartungshaltung der allermeisten Besucher sein. Aber wenn schon eine extra Anzeige der Relevanz, dann bitte auch eine nachvollziehbare. Ich dachte zuerst, dass das Maximum bei 5.0 liegen würde, bis ich dann ein Suchergebnis mit 5.2 erhielt.

      Also die momentanen Bewertungskriterien sind:
      Treffer in h2: 2 Punkte
      Treffer in h3: 1 Punkte
      Treffer in h4: 0.5 Punkte
      Treffer in sonstigem Content-Text: 0.1 Punkte aber maximal 1 Punkt***
      Treffer in der Page-Description: 0.2 Punkte
      Treffer in Keywords: 1 Punkt
      Treffer im Title: 1 Punkt

      ***sollte ich ändern.
      Ev. ist der Treffer im title zu hoch bewertet.

      Gänzlich "unbrauchbar" wird so eine Relevanzanzeige, wenn du so allgemeine Suchbegriffe wie "und" zulässt. Hier bedarf es imho einer Liste mit Wörtern, die zumindest bei einer Volltextsuche ausgeschlossen werden.

      OK. Guter Punkt. Aber sollte der Suchende sich der Problematik solcher Worte nicht bewusst sein? Ich erlaube mir, Suchbegriffe zu tilgen, die kürzer als 3 Buchstaben sind.
      Ich denke, zu viel im User-Suchbegriff rumzuwursteln, macht eine Suche auch nicht besser... Am Schluss muss ich jedes Wort dokumentieren, das verworfen wird.

      Aber kurze Worte haben auch etwas für sich.
      "kurz ODER langes_wort"
      Ein Treffer auf langes_wort sollte höher bewertet werden als ein Treffer auf kurz.

      Fazit:
      Gerade bei einem CMS sollte eine Suchfunktion möglichst vielseitig sein (ODER und UND Verknüpfungen, Volltextsuche oder nur ganze Wörter, nach Themen und/ oder Schlagwörtern suchen, etc. pp).

      Vielleicht könnte ich ja den Suchenden auch die Bewertung in den verschiedenen Bereichen etwas einstellen lassen. Dadurch bekommt er eher einen Bezug zur Gewichtung.

      Etwas scheint mir noch konfigurierbar:
      Wordboundery: Exaktes Wort

      Danke, das war schon ein guter Input.

      mfg Beat

      --
      ><o(((°>           ><o(((°>
         <°)))o><                     ><o(((°>o
      Der Valigator leibt diese Fische