Suchmaschine mir volltextsuche!
Günter S. Heinrich
- javascript
...ersteinmal einen wunderschönen Happy Valentinsday an alle! :o)
Ich habe schon im Archiv nachgeschaut, ob ich was über Suchmaschinen mit Volltextsuche finde, wurde auch ein wenig fündig, doch nicht das was ich bräuchte, (denke ich mir).
Ich suche nämlich eine Suchmaschine die in einem Firmenintranet einzusetzen ist. Von Suchmaschinen habe ich keine Ahnung, wie es funktioniert so an die 200 Seiten sich "indizieren?" zu lassen, damit ich nicht selber die Begriffe eingeben muss.
vielleicht kann mir ja jemand von euch helfen?
liebe Grüsse
Günter
Hallo Günter,
nachdem Du von Intranet sprichst, gehe ich mal davon aus, daß es auch einen zentralen Rechner gibt. Insofern würde ich die Sache mit JavaScript mal schnell vergessen und eine sinnvollere Lösung anpacken. JavaScript müßte stets clientseitig ausgeführt werden, d.h. jedesmal wird neue durchsucht. Eine Lösung über CGI oder PHP könnte serverseitig gespeichert werden und könnte auch dort den Index zur Verfügung stellen.
Lösungen in PHP und CGI gibt's in vielen Scriptarchiven.
Grüße aus Würzburg
Julian
Hi Julian,
danke für die Antwort.
nachdem Du von Intranet sprichst, gehe ich mal davon aus, daß es auch einen zentralen Rechner gibt.
Nein den gibt es nicht. Die Dateien liegen auf einem Laufwerk, auf dem jede Menge anderes Zeugs auch liegt. Und irgenwo da habe ich mir halt einen Ordner angelegt, meine HTML Seiten reingespeichert, und in diesen Ordnern soll halt mal alles durchsucht werden. Wenn ich jetzt z. b. in der Suchmaschine das Wort "Mitarbeiter" eintrage, soll er mir alle LInks (dateien) anzeigen, in denen das Wort Mitarbeiter vorkommt.
Lösungen in PHP und CGI gibt's in vielen Scriptarchiven.
ich hab schon ein paar gesehen, doch da kenne ich mich gleich noch weniger aus, und wie der Teufel es mal so will, hätte das ganze natürlich schon gestern fertig sein sollen, ...das übliche halt! :o)
Ich finde die Suchmaschine von Oliver Garcia auch leider hier nicht mehr, den Link, den ich fand, linkt auf eine Seite wo seit einem halben Jahr steht das demnächst eine neuere Version zu Tage kommt.
Gruß aus dem heute stürmischen München
Günter
Hallo Günter,
Nein den gibt es nicht.
:-( Ok, ist dann nicht mehr so angenehm.
Ich finde die Suchmaschine von Oliver Garcia auch leider hier nicht mehr,
In der Suchdatei von Selfhtml steht "Falls Sie Interesse haben, eine auf Ihre Datenbestände angepaßte Version dieser Suchmaschine in Lizenz zu erwerben, erhalten Sie unter mailto:suchmaschine@ogu.de mehr Informationen". Wenn ich davon ausgehe, daß jeder halbswegs internetinteressierte mindestens jeden zweiten Tag Mails abruft, dann wäre ein Mail an ihn vielleicht einen Versuch wert.
Ansonsten siehts, von meiner Seite her düster aus, da zu wenig Ahnung von JavaScript.
Grüße aus Würzburg
Julian
Hallo Günter,
Nein den gibt es nicht.
:-( Ok, ist dann nicht mehr so angenehm.
Ich weiß.
In der Suchdatei von Selfhtml steht "Falls Sie Interesse haben, eine auf Ihre Datenbestände angepaßte Version dieser Suchmaschine in Lizenz zu erwerben,
Ich glaube nicht das hier jemand einen Pfennig ausgibt, auch wenn sie die beste sein sollte. *seufz*
Aber ich werde ihm trotzdem mal schreiben.
Ansonsten siehts, von meiner Seite her düster aus, da zu wenig Ahnung von JavaScript.
Ich ja leider auch! Ich habe hier zwar eine Javasuchmaschine, aber die ist halt nicht volltext basiert, mit anderen Worten, man muss JEDES einzelne Wort was man suchen lassen will, auch einzeln eingeben! Da bräuchte ich für eine HTML seite die einigermaßen voll geschrieben ist, 3Tage. ...und der Umfang um den es insgesamt geht hat jetzt schon 200 Seiten.
nochmals
Hallo,
http://petra1s.die.unige.it/jsSQL/
vielleicht hlift's.
Falk
Tag auch!
nachdem Du von Intranet sprichst, gehe ich mal davon aus, daß es auch einen zentralen Rechner gibt.
Nein den gibt es nicht. Die Dateien liegen auf einem Laufwerk, auf dem jede Menge anderes Zeugs auch liegt. Und irgenwo da habe ich mir halt einen Ordner angelegt, meine HTML Seiten reingespeichert, und in diesen Ordnern soll halt mal alles durchsucht werden. Wenn ich jetzt z. b. in der Suchmaschine das Wort "Mitarbeiter" eintrage, soll er mir alle LInks (dateien) anzeigen, in denen das Wort Mitarbeiter vorkommt.
Damit ist das dann _kein_ Intranet, sondern ein Filserver, auf dem Irgendwo Dateien liegen.
Weil: Man spricht überall da von Intranet, wo innerhalb eines privaten Netzwerks die Technologie zum Einsatz kommt, die auch im Internet eingesetzt wird. Der Unterschied ist eben, das diese art von Internet nicht global erreichbar ist.
Also: Um das ganze zum Intranet zu machen braucht es auch hier einen Webserver. Ohne Webserver _kein_ CGI...
Ich würde daher überlegen, ob es sich lohnt einen Webserver für das lokale Netz einzurichten.
Viel Spaß noch
bye
ich
Hi Julian,
danke für die Antwort.
nachdem Du von Intranet sprichst, gehe ich mal davon aus, daß es auch einen zentralen Rechner gibt.
Nein den gibt es nicht. Die Dateien liegen auf einem Laufwerk, auf dem jede Menge anderes Zeugs auch liegt. Und irgenwo da habe ich mir halt einen Ordner angelegt, meine HTML Seiten reingespeichert, und in diesen Ordnern soll halt mal alles durchsucht werden. Wenn ich jetzt z. b. in der Suchmaschine das Wort "Mitarbeiter" eintrage, soll er mir alle LInks (dateien) anzeigen, in denen das Wort Mitarbeiter vorkommt.
Noch mal zur Nachfrage: Gibt es nur dieses Verzeichnis, das Du als "Intranet" bezeichnest, oder ist dieses Verzeichnis der document-root für einen Webserver, das ist überaus wichtig, da im ersteren Fall alle Server-seitigen Dinge (PHP, Perl) wegfallen!!
maja
Hallo Maja,
ersteinmal vielen Dank für die Hilfe. :o)
Noch mal zur Nachfrage: Gibt es nur dieses Verzeichnis, das Du als "Intranet" bezeichnest,
Es gibt NUR dieses Verzeichnis (Ordner), mit Unterverzeichnissen, in denen alle HTML Seiten, sowie die dazugehörigen Bilder liegen.
oder ist dieses Verzeichnis der document-root für einen Webserver, das ist überaus wichtig, da im ersteren Fall alle Server-seitigen Dinge (PHP, Perl) wegfallen!!
Es gibt kein "dokument-root" sprich einen Webserver.
Wie gesagt, alles liegt in einem Ordner in einem Laufwerk im Explorer (WinNT). Und dadurch das die anderen Abteilungen bei uns in der Firma dieselben Laufwerksverbindungen haben sollte es auch klappen.
Grüsse aus dem sonnigen München
Günter
Hallo Maja,
ersteinmal vielen Dank für die Hilfe. :o)
Noch mal zur Nachfrage: Gibt es nur dieses Verzeichnis, das Du als "Intranet" bezeichnest,
Es gibt NUR dieses Verzeichnis (Ordner), mit Unterverzeichnissen, in denen alle HTML Seiten, sowie die dazugehörigen Bilder liegen.
oder ist dieses Verzeichnis der document-root für einen Webserver, das ist überaus wichtig, da im ersteren Fall alle Server-seitigen Dinge (PHP, Perl) wegfallen!!
Es gibt kein "dokument-root" sprich einen Webserver.
Wie gesagt, alles liegt in einem Ordner in einem Laufwerk im Explorer (WinNT). Und dadurch das die anderen Abteilungen bei uns in der Firma dieselben Laufwerksverbindungen haben sollte es auch klappen.
Gut, dann hätte ich was für Dich, wenn das ein Windows-Rechner ist:
http://www.researchsuite.de/download.htm
ganz unten "Salz & Pfeffer Leicht 1.0"
Aus der Beschreibung (http://www.researchsuite.de/index.htm):
Der Ansatz der lokalen Suchmaschine erlaubt es,
web-basierte Suchmaschinen zu erzeugen, die
ohne Server-Software oder CGI-Zugriff genutzt
werden können. Hierdurch ist es möglich, ein und
dieselbe Suchmaschine - ohne Anpassungsaufwand
Maja
Hallo Maja,
Gut, dann hätte ich was für Dich, wenn das ein Windows-Rechner ist:
*freu*
http://www.researchsuite.de/download.htm
ganz unten "Salz & Pfeffer Leicht 1.0"
Werde ich gleich mal hinschauen.
schon mal vielen vielen Dank, und ein schönes Wochenende! :o)
liebe Grüsse
Günter
Hallo,
Ich finde die Suchmaschine von Oliver Garcia auch leider hier nicht mehr, den Link, den ich fand, linkt auf eine Seite wo seit einem halben Jahr steht das demnächst eine neuere Version zu Tage kommt.
Nun, die Suchmaschine selbst dürfte eigentlich nicht schwer zu finden
sein. Es handelt sich um diejenige, die in Selfhtml 8.0 enthalten ist.
Die entsprechende Hinweisseite, das gebe ich zu, hätte ich längst schon
einmal aktualisieren müssen.
Deshalb zuerst an dieser Stelle die Ankündigung, daß
ich voraussichtlich in den nächsten paar Monaten ein Programm
ins Netz stellen werde, daß erlaubt, quasi auf Knopfdruck,
d.h. ohne große Kenntnisse und Anpassungsaufwand, eigene
Suchmaschinen nach dem Modell, das bei Selfhtml zum Einsatz
kommt, zu erstellen.
Das ganze muß noch programmiert werden, deshalb kann ich
leider nicht genauer sagen, wann es soweit sein wird.
Die Lizenz wird kostenlos sein für Projekte kleineren
Zuschnitts. Für größere Projekte werden die Kosten
gestaffelt sein.
Die kostenlose Version wird nicht nur denen entgegenkommen,
die auch für das Beste keinen Pfennig ausgeben wollen, sondern
auch Interessenten, die größere Projekte haben, die
Möglichkeit geben, unverbindlich zu testen, ob die
Suchmaschine für ihre Zwecke brauchbar ist.
Demnächst wird auch eine neue Version der Selfhtml-
Suchmaschine herauskommen. Neben der Behebung einiger kleinerer
Probleme (wie etwa im Zusammenhang mit der Markierung der
Suchtreffer) werden insbesondere zwei Neuerungen kommen:
Die Suchmaschine wird dann endlich auch im Internet Explorer
(zumindest dessen neueren Versionen) in http-Umgebung,
daß heißt im Internet und Intranet laufen.
Zum anderen werden die noch vorhandenen kleineren Beschränkungen
in der Unterstützung von Netscape 6 (Gecko) wegfallen.
Grüße,
Oliver
Hi Günter!
Ich habe recht gute Erfahrungen mit "SimplytheBestScript" gemacht (Link für die Suchmaschinen-Skripte: http://www.simplythebest.net/cgiscripts/searching.html).
Dort gibt es jede Menge fertige und leicht konfigurierbare CGI-Scripts (btw: Java-Script würde ich für die Lösung eines solchen Problems auch nicht empfehlen). Ich habe mir dort zum Beispiel ICE runtergeladen. Das Ding ist zugegebenermassen ziemlich alt. Aber wenn man sich ein Perl-Handbuch schnappt und das Programm mal durchgeht, kapiert man recht schnell wie's funktioniert. Ich war nach 2 Tagen soweit, dass ich einige Sachen ändern konnte und das Ding langsam das gemacht hat, was ich wollte. Nach 'ner Woche war das Script dann von der Geschwindigkeit und von den Features her besser als vorher (dass den Code außer mir sonst noch jemand lesen kann, bezweifle ich allerdings :). Nebenbei habe ich den Einstieg in Perl geschafft, was - glaube _ich_ - nicht unbedingt von Nachteil ist.
Der Vorteil an ICE ist übrigens, dass zwei getrennte Programme, eins für die Indizierung Deiner Seiten und eins für die eigentliche Suchfunktion vorhanden sind. Es bietet also ein recht gutes Gerüst.
Eine große Hilfe für den Einstieg in Perl - falls Du den wagen willst - findest im übrigen hier in SELFHTML:
http://selfhtml.teamone.de/cgiperl/index.htm
Viele Grüsse
Tobi H.
Moin
Ich suche nämlich eine Suchmaschine die in einem Firmenintranet einzusetzen ist. Von Suchmaschinen habe ich keine Ahnung, wie es funktioniert so an die 200 Seiten sich "indizieren?" zu lassen, damit ich nicht selber die Begriffe eingeben muss.
Wenn über HTTP, dann Fluid dynamics: http://www.xav.com/scripts/search/ Gut, schnell, preiswert, einfach zu konfigurieren, für ein paar tausend Dokumente reicht das vollkommen.
Wenns was besonderes sein soll dann gibt es hier dicke Listen: http://www.suchfibel.de/7personlich/serversoftware.htm und http://www.searchtools.com/ (englisch)
hth, gruss, kaz
Hi auch,
Wenn über HTTP, dann Fluid dynamics:
http://www.xav.com/scripts/search/
Gut, schnell, preiswert, einfach zu konfigurieren,
für ein paar tausend Dokumente reicht das vollkommen.
yep. Und wenn irgendwas an den deutschen Texten der Konfigurations-Seiten
nicht tut, darfst Du überwiegend mich dafür hauen.
Viele Grüße
Michael
Sup!
Ich empfehle htdig <www.htdig.org>.
Es wird aktiv weiterentwickelt, es gibt eine recht umfangreiche Website dazu und auch eine Mailingliste mit einem Archiv, in dem eigentlich jede Frage beantwortet ist. Es gibt "Plug-ins", mit denen man auch .doc, .ps und .pdf und alles andere indizieren kann, es ist relativ schnell, es verbraucht relativ wenig Plattenplatz, es laeuft unter quasi jedem Unix, bei SuSE ist es dabei... und es nutzen auch viele Unis, z.B. die von Muenchen oder auch das Rechenzentrum von Erlangen *fg*.
Gruesse,
Bio
Ersteinmal ein riesen großes Danke an alle!
(dachte schon mein thread geht unter, und das bei dem schnellen Schwanzabschneider. ;o)
Jetzt werde ich mir ersteinmal alle Links von euch anschauen.
Dank auch an Oliver Garcia, (somit muss ich Dir nicht mehr schreiben! :o)
ich wünsche euch allen noch ein erholsames Wochenende
liebe Grüsse
Günter