Huhu mic
zumindest mit dieser hervorheben sache, weill ja oft nach mehreren begriffen gesucht wird und der text um die suchbegriffe herum sich manmchal überschneidet etc.
Ja, habe eben nochmal geguckt wie google das macht.
Es werden da anscheinend maximal drei Ausschnitte (mit Treffer) aus der Seite angezeigt.
Vor einem Treffer werden rund 50 Zeichen angezeigt (unter Berücksichtigung der Wortgrenzen).
Nach einem Treffer zwei Worte, wobei zweibuchstabige Wörter nicht mitzählen.
Das nenne ich jetzt mal Trefferzone.
Wenn sich Trefferzonen überschneiden werden diese bei der Ausgabe zusammengefasst.
So habe ich das jedenfalls mit der "versuch-macht-kluch-Methode" ermittelt.
Das Problem ist nicht uninteressant, werde auch mal versuchen
etwas in der Richtung zusammenzuschrauben.
Vermutlich ist es hilfreich vorher die Regeln (in natürlicher Sprache ) festzulegen, wie mit den (Mehrfach)- Treffern umgegangen werden soll.
Und/ oder man legt einen Beispieltext zu Grunde der ein paar knifflige Konstellationen enthält und markiert erstmal die Stellen wie sie von der Suchfunktion ausgegeben werden sollen.
Wenn man dann noch die einzelnen Suchbegriffe unterschiedlich gewichtet, oder z.B. Trefferzonen mit mehreren Hits nach Zahl der Treffer entsprechend bewertet, HTML-Tags berücksichtigt etc. wird es langsam interessant ;-)
(Allerdings braucht man das evtl. auch gar nicht)
Viele Grüße
lulu
bythewaythewebsuxgoofflineandenjoytheday