Hi Ingolf,
ich suche für meine Suchmaschine bzw. für die Indizierung eine
Stopwortliste
eine "allgemeine" Stopwortliste kann es gar nicht geben.
Die ist immer abhängig von Deinem Kontext - beispielsweise der
Bedeutung Deiner Dokumente und der darin verwendeten Sprache.
Ein Wort, das in einem Kontext ein Stopwort ist (z. b. "ist"), kann
in einem anderen Kontext ein notwendiger Fachbegriff sein (z. B. "IST").
Mit wechselnden Sprachen ist das genauso.
Ich empfehle Dir, Deinen eigenen Wort-Vorrat zu indexen und eine Häufig-
keitsliste zu berechnen. Aus den Top 2% dieser Liste bildest Du Dir per
manuellem Ausleseverfahren Deine eigene Stopwortliste, indem Du alles
aus diesen Top 2% entfernst, wonach ein Anwender Deiner Suchfunktion
sinnvollerweise suchen können möchte.
Viele Grüße
Michael