Felix Senn: Suchfunktionen

Hallo erstmal,

dieses Forum hat sich in den letzten Monaten wirklich zu einer Ansammlung "brillianten Wissens" entwickelt. Gerade bei speziellen Problemen hilft einem ein "normales Handbuch" (oder auch SELFHTML) nicht mehr weiter. Genau hier setzt diese NewsGroup ein.

Was ich hier allerdings vermisse ist die Möglichkeit in alten Einträgen suchen zu können. In der Regel wurde ein Problem in den Vormonaten bereits beschrieben - leider findet man es nicht mehr. Daher mein Vorschlag: Auch dieses Forum braucht eine Suchfunktion!

Ich bin gerne bereit an diesem Problem mitzuarbeiten (evtl. die Suchfunktion in Perl, C/C++, Pascal o. a. Java) zu programmieren.

Es wäre doch schade, wenn diese Informationen verloren gehen würden...

Gruß
Felix

  1. Was ich hier allerdings vermisse ist die Möglichkeit in alten Einträgen suchen zu können. In der Regel wurde ein Problem in den Vormonaten bereits beschrieben - leider findet man es nicht mehr. Daher mein Vorschlag: Auch dieses Forum braucht eine Suchfunktion!

    Da liegen wir wohl auf der gleichen Wellenlänge. Auch ich habe diesen Vorschlag bereits unterbreitet, aber es scheint derzeit noch kein Vernünftiges Konzept vorhanden zu sein.
    Daher mein Vorschlag: Bereits beim Eintragen sollte man anklicken, in welche Rubrik das Problem gehört. z.B.: HTML, Java, CGI/Perl, CSS, Browser, usw.

    Vielleicht könnte man so den ersten Schritt tun.

    Gruß Andre

    1. Hallo Andre,

      das mt der Rubrik finde ich nicht so gut. Es gibt dann sehr schnell sehr viele Rubriken oder lauter falsch einsortierte Nachrichten.

      Mein Vorschlag: Volltextsuche, aber auch nach Autor

      Weiter: Es wäre auch schön, wenn das Anklicken einer Nachricht ein neues Browser-Fenster öfnen würde. Man könnte dann angenehmer im Thread navigieren.

      Roland

      1. Hallo Roland,

        Weiter: Es wäre auch schön, wenn das Anklicken einer Nachricht ein neues Browser-Fenster öfnen würde. Man könnte dann angenehmer im Thread navigieren.

        Dazu gibt's die rechte Maustaste und das Kontextmenue unterm Link. Ich will den Anwendern da keine Vorschriften machen, indem ich tausend Fenster oeffne. Ich selber oeffne die Beitraege auch immer im neuen Fenster, aber das kann ja jeder andere auch, wenn er will.

        Viele Gruesse
          Stefan Muenz

        1. Hallo, Stefan und Roland,

          Weiter: Es wäre auch schön, wenn das Anklicken einer Nachricht ein neues Browser-Fenster öfnen würde. Man könnte dann angenehmer im Thread navigieren.

          Dazu gibt's die rechte Maustaste und das Kontextmenue unterm Link.

          Die mittlere bei einer Drei-Tasten-Maus tuts auch.

          Ich will den Anwendern da keine Vorschriften machen, indem ich tausend Fenster oeffne. Ich selber oeffne die Beitraege auch immer im neuen Fenster, aber das kann ja jeder andere auch, wenn er will.

          Dem schließe ich mich vollinhaltlich an.

        2. Hallo Stephan,
          Du hast ja recht, aber leider ist mein Zeigefinger oft schneller!

          Roland

  2. Moin,

    Nachdem das Thema Suchen hier immer wieder Gegenstand der Diskussion ist, möchte ich ein paar Gedanken dazu loswerden. Soviel vorweg: Es wird nicht klappen.

    Warum?

    Das erste Problem ist das leichteste: Womit wird gesucht? Man nehme eines der sattsam bekannten Perl Skripte, vielleicht auch eines der ausgefeilteren.

    Dann wirds schon etwas schwieriger: Worin wird gesucht? Das können entweder die alten Beiträge sein, in ihrer Form als einzelne HTML Seiten oder die Zusammenfassungen, die Stefan regelmäßig mit dem "Schwanzabschneider" erstellt. Wenn ichs richtig verstanden habe, dient dieses Tool unter anderem dazu, die Masse an Dateien auf dem Server zu verkleinern. Im ersten Falle müßten sämtliche Einzeldateien und die jeweilige Zentralseite erhalten bleiben. Im zweiten Falle wären die zu durchsuchenden Objekte die Zusammenfassungen. Lange Seiten mit zig Threads.

    Hier lauert das nächste Problem: Um die einzelnen Beiträge dann lokalisieren zu können, müssen einzelne Anker und IDs vergeben werden, denn ein Suchergebnis, das aus einer Seite mit 20 Threads besteht, muss sonst nochmal umständlich von Hand mit der Suchfunktion des Brauses durchsucht werden.

    Die groessten Probleme sind aber die der Relevanz der Suchergebnisse und der Möglichkeiten der Gewichtung: In diesem Forum werden Diskussionen um immer dieselben und dabei nur sehr wenige Begriffe geführt: Frames, Tabellen, JavaScript, Objekt, etc. Alle diese Begriffe werden erst im Zusammenhang mit einem konkreten Problem und dessen Lösung interessant. Das heisst: Ein kompletter Satz konkretisiert das Thema. Aber welcher? Die wenigsten Threadtitel sind aussagefähig.

    Was ist mit Tippfählern, Threaddrift, korrekter Terminologie? heisst es: animiertes gif, animated gif, Gifanimation, Gif-Animation, Gif animieren, Animierte Gif‚s? Oder gif‚s animieren? Alle diese Begriffe sind unterschiedliche Zeichenketten und würden von einer Volltextsuchmaschine als komplett eigenständig behandelt werden. In welchem Zusammenhang steht als der Begriff jeweils? Muss man also verschiedene Phrasensuchen probieren?

    Wonach soll man also suchen? Alle Alternativen eintippen?
    Worin soll gesucht werden? Da die Threadtitel nicht recht funktionieren, im Volltext? Dann gibt es noch mehr in verschiedenen Zusammenhängen vorkommende Begriffe. Also muss eine Gewichtung her. Wie soll gewichtet werden? Erst der Titel, dann der Text, dann die Häufigkeit des Vorkommens des Begriffes? Wie ist sichergestellt, dass der Begriff auch wirklich oft genug vorkommt?

    Ihr seht: So simpel isses nicht. Selbst ein solchermassen immernoch unzureichend funktionierendes Maschinchen muss ziemlich komplex sein.

    Das ist übrigens nicht allein auf meinem Mist gewachsen, sondern eine Zusammenfassung einer Diskussion mit Stefan Müller, der das Profimaschinchen www.blinde-kuh.de, eine Suchmaschine speziell für Kids programmiert hat. Wir sind, was die Probleme angeht, ziemlich einer Meinung.

    Es gibt allerdings einen Lösungsansatz: Jeder Beitrag kann vom Verfasser in eine Rubrik einsortiert werden, die möglichst detailliert erarbeitet werden muss. Was aber mit den Grenzfällen? Wenn sich herausstellt, dass ein in JavaScript eingeordneter Beitrag in die Schachtel mit Brauserbugs gehört?

    Zusammenfassend: Die bisherigen Beiträge technisch "irgendwie" maschinell durchsuchbar zu machen ist einfach. Daraus ein funktionierendes Werkzeug zu bauen, das auch tatsächlich relevante Treffer zu komplexen Abfragen bringt, ist ohne redaktionellen Input unmöglich.

    Dauerhaft sinnvoll ist das manuelle Einsortieren der Beiträge in verschiedene Rubriken, NACHDEM die Threads abgeschlossen sind. Da kann man dann ein kleines Maschinchen drüberrappeln lassen. Sinnvoller wäre aber eine Verschlagwortung. Eine Heidenarbeit, die nie abreisst. Wenn es jemanden gibt, der das bringt - Applausapplaus!

    Stefan Karzauninkat

    1. Nachdem das Thema Suchen hier immer wieder Gegenstand der Diskussion ist, möchte ich ein paar Gedanken dazu loswerden. Soviel vorweg: Es wird nicht klappen.

      Ich bin da ganz deiner Meinung, was das technische betrifft. Ich will nur noch etwas grundsaetzliches ergaenzen:

      Ich finde es ueberhaupt nicht schlimm, wenn hier Themen immer wieder auftauchen. Erstens geschieht dies nicht in zu grossem Masze, und zweitens lernen es dann auch die, die es beim vorigen mal nicht verstanden haben oder gerade im Urlaub nicht an den Computer gedacht haben. Ausserdem ist so ein Forum ja keine Lexikon, oder FAQ. Ich mag es einfach so wie es ist. <smile>

    2. Hallo Stefan,

      danke fuer diesen kompetenten Beitrag, den sich hoffentlich alle zu Herzen nehmen, die mal eben was Tolles fordern, aber sich wohl kaum vorstellen koennen, was fuer eine Arbeit es bedeutet, so etwas wirklich ordentlich zu realisieren.

      Und so viel will ich noch ergaenzen. Wer einfach volltextmaessig und ohne Intelligenz nach irgendwelchen Schlagwoertern suchen will, speichere sich einfach alle Archivdateien lokal ab (spart auch Online-Kosten) und jage dann die Suchfunktion irgendeines Programms (unter Win95 tut's auch die Standardsuche im Startmenue) darueber.

      Und beim naechsten Mal, wo dieses Thema auftaucht, werden die Leute gleich hier zu diesem Thread geschickt <g>.

      Viele Gruesse
        Stefan Muenz

      1. Hi Stefan

        Und so viel will ich noch ergaenzen. Wer einfach volltextmaessig und ohne Intelligenz nach irgendwelchen Schlagwoertern suchen will, speichere sich einfach alle Archivdateien lokal ab (spart auch Online-Kosten) und jage dann die Suchfunktion irgendeines Programms (unter Win95 tut's auch die Standardsuche im Startmenue) darueber. <<

        Zur Illustration und zum Ausprobieren kann sich jeder den kostenlosen AltaVista Discovery fuer den Desktop (WIN) holen und mal probieren. Das Teil hat die meisten Features wie Gewichtung und Volltextsuche und wird trotzdem an den genannten Problemen scheitern. Und andere aufzeigen, die ich noch nicht angesprochen habe: Serverlast, Indexgroesse, Performance, Sortierung, etc.

        Anyway, ein erstklassiges Tool ist Discovery von AltaVista schon. Wiegt allerdings 10 MB.

        http://discovery.altavista.digital.com

        Viele Gruesse
        Stefan Karzauninkat

    3. Sorry, ich hatte grad mal was anderes zu tun,

      Stefan Karzauninkat:

      » Das ist übrigens nicht allein auf meinem Mist gewachsen, sondern eine Zusammenfassung
      » einer Diskussion mit Stefan Müller, der das Profimaschinchen www.blinde-kuh.de, eine
      » Suchmaschine speziell für Kids programmiert hat. Wir sind, was die Probleme angeht,
      » ziemlich einer Meinung.

      stimmt, stimmt, stimmt.

      Wir wuerden dabei definitiv Unsinn machen. Und es waere eine unsinnige
      monstroese Arbeit, die sich am Ende vielleicht auch gar nicht lohnt.

      Tatsaechlich ist das ein heiden Problem, irgendwas halbwegs intelligentes fuer
      dieses Forum hinzuzimmern. Es ist in der Tat nicht so, dass wir nicht die Mittel
      und die Maschinchen haetten, dieses Forum durchsuchbar zu machen, aber
      dass auch noch etwas gefunden werden soll, was sinnvoll sein soll, das ist
      technisch unmoeglich.

      Es kommt noch erschwerend dazu, das sehr oft immer wieder die selben Fragen
      und Antworten gestellt werden, also eigentlich offenbar nur wenige an den Inhalten
      des Forums sind, und wie meist auch ersichtlich, an den bereits vorhandenen Inhalten
      dieses praechtigen SelfHTML++ interessiert sind, sondern meist einen kleine Quicki-
      Frage stellen und eine ausfuerhliche Bauanleitung wuenschen.

      Ich denke, darin liegt ein wenig der Hund begraben.

      Was Sinn macht, ist die redaktionelle Aufarbeitung  der einzelnen Sachen hier,
      sofern sie den aufarbeinswert sind, was nicht selten nicht der Fall ist.

      Drehen wir doch einfach mal den Spiess um.

      In diesem Forum steckt genug Material, das einer didaktischen und aesthetisch
      gelungen redaktionellen Zusammenfassung wert ist. Warum greifen denn nicht
      die Leute zu, die meinen, da waere was drin, und schreiben einfach eine Rubrik
      unter Beiträge von Anwendern auf der Seite

      http://www.teamone.de/selfaktuell/

      Den Ruf nach pfiffigen Algorithmen in allen Ehren, aber manchmal kann man sich
      die Arbeit auch erleichtern, und nicht nur sich, in dem man sich selbst zur
      redakzionellen Arbeit hinreissen laesst und anderen die Moeglichkeit gibt, auf
      Fragen Antworten zu finden.

      SelfHTML ist zumindest in diesem Geist entstanden, wenn es etwas zu zocken
      gibt, dann sollte es dieser Geist sein.

      Wenn ich etwas hier programmieren wuerde, dann ein Bounce-Programm, das
      alles abwehrt, was schon mal gefragt wurde ;-)

      eben Quick And Dirty.

      Wenn Ihr alle hier dem Chaos maechtig werden wollt, dann versucht es doch mal
      mit Disziplin (Lesen der Vorgaenger-Fragen) und Malochen (Aufbereitung der
      Fragen und Antworten).

      Schoene Gruesse aus Hamburg

      Stefan R. Mueller