Ingolf: Suche allg. Stop(p)wortliste

Moin,

ich suche für meine Suchmaschine bzw. für die Indizierung eine Stopwortliste - bisher habe ich nur die paar Wörtchen aus der Freitextseite der TU-Berlin

hat jemand noch´n Tipp für mich..??

Gruss Ingolf

  1. Moin,

    ich suche für meine Suchmaschine bzw. für die Indizierung eine Stopwortliste - bisher habe ich nur die paar Wörtchen aus der Freitextseite der TU-Berlin

    hat jemand noch´n Tipp für mich..??

    http://www.google.de/search?q=Stoppwortliste
    http://www.google.de/search?q=Stopwortliste

    Erste Treffer:

    http://support.ddb.de/iltis/indexieren/stopp.htm
    http://www.epd-archiv.de/dok_epdStoppWortListe_01.htm

    Grüße,

    Sebastian

    1. Moin,

      hat jemand noch´n Tipp für mich..??

      Noch ein Treffer:

      http://www.silverplatter.com/newFieldGuides/rswb/Stoppworte.htm

      Grüße,

      Sebastian

  2. Hi Ingolf,

    ich suche für meine Suchmaschine bzw. für die Indizierung eine
    Stopwortliste

    eine "allgemeine" Stopwortliste kann es gar nicht geben.
    Die ist immer abhängig von Deinem Kontext - beispielsweise der
    Bedeutung Deiner Dokumente und der darin verwendeten Sprache.
    Ein Wort, das in einem Kontext ein Stopwort ist (z. b. "ist"), kann
    in einem anderen Kontext ein notwendiger Fachbegriff sein (z. B. "IST").
    Mit wechselnden Sprachen ist das genauso.

    Ich empfehle Dir, Deinen eigenen Wort-Vorrat zu indexen und eine Häufig-
    keitsliste zu berechnen. Aus den Top 2% dieser Liste bildest Du Dir per
    manuellem Ausleseverfahren Deine eigene Stopwortliste, indem Du alles
    aus diesen Top 2% entfernst, wonach ein Anwender Deiner Suchfunktion
    sinnvollerweise suchen können möchte.

    Viele Grüße
          Michael