Suche allg. Stop(p)wortliste
Ingolf
- datenbank
Moin,
ich suche für meine Suchmaschine bzw. für die Indizierung eine Stopwortliste - bisher habe ich nur die paar Wörtchen aus der Freitextseite der TU-Berlin
hat jemand noch´n Tipp für mich..??
Gruss Ingolf
Moin,
ich suche für meine Suchmaschine bzw. für die Indizierung eine Stopwortliste - bisher habe ich nur die paar Wörtchen aus der Freitextseite der TU-Berlin
hat jemand noch´n Tipp für mich..??
http://www.google.de/search?q=Stoppwortliste
http://www.google.de/search?q=Stopwortliste
Erste Treffer:
http://support.ddb.de/iltis/indexieren/stopp.htm
http://www.epd-archiv.de/dok_epdStoppWortListe_01.htm
Grüße,
Sebastian
Moin,
hat jemand noch´n Tipp für mich..??
Noch ein Treffer:
http://www.silverplatter.com/newFieldGuides/rswb/Stoppworte.htm
Grüße,
Sebastian
Hi Ingolf,
ich suche für meine Suchmaschine bzw. für die Indizierung eine
Stopwortliste
eine "allgemeine" Stopwortliste kann es gar nicht geben.
Die ist immer abhängig von Deinem Kontext - beispielsweise der
Bedeutung Deiner Dokumente und der darin verwendeten Sprache.
Ein Wort, das in einem Kontext ein Stopwort ist (z. b. "ist"), kann
in einem anderen Kontext ein notwendiger Fachbegriff sein (z. B. "IST").
Mit wechselnden Sprachen ist das genauso.
Ich empfehle Dir, Deinen eigenen Wort-Vorrat zu indexen und eine Häufig-
keitsliste zu berechnen. Aus den Top 2% dieser Liste bildest Du Dir per
manuellem Ausleseverfahren Deine eigene Stopwortliste, indem Du alles
aus diesen Top 2% entfernst, wonach ein Anwender Deiner Suchfunktion
sinnvollerweise suchen können möchte.
Viele Grüße
Michael