Hi Andreas,
P.S.: Überlege Dir mal, wieso die Suchmaschine des
Self-Portals mehrere Indexdateien durchsuchen
kann und nicht nur eine einzige ...
??? ich hatte immer gedacht diese basiere auf MySQL???
Nein. Das sind ganz normale ASCII-Dateien, spaltensepariert mit senkrechten Strichen, und ein Haufen Perl-Logik mit regulären Ausdrücken.
Sind das die Verschiedenen Index-Dateien, halt
Forum 2002, 2001, 2000... SELFHTML..?
Genau. Zwar haben alle dasselbe Format (so wie alle
Zeilen Deiner Tabelle), aber ich wollte bewußt die
Möglichkeit schaffen, nur Teilmengen derselben zu
durchsuchen, um dem Anwender zu erlauben, weniger
Last auf dem Server zu verursachen und gleichzeitig
seine Ergebnisse schneller zu erhalten. (Deshalb ist
der Defaultwert auch, die kleinen Indexdateien mit
der hohen inhaltlichen Qualität automatisch zu selek-
tieren und die großen mit dem Archiv-Material nicht.)
Sind das jeweils eigene Indexdateien? heißt das ihr
habt z.B. die Ausgabe aller Forumsbeiträge 2001 in
eine einzige Datei geschrieben?
Im Prinzip ja - allerdings bereits vorverarbeitet.
HTML-tags sind beispielsweise keine mehr drin.
Wie kann man sowas denn strukturiert durchsuchen
und die originalen Dateien als Links generieren?
Genau so, wie Du das mit SQL auch machen würdest:
Jede Zeile hat knapp 10 Spalten, und der URL des
Originals ist eine dieser Spalten.
Kann man sich sowas mal angucken, bzw. gibt es
irgendwo Infos wie die Self-Suche genau funktio-
niert?
Hm ... ja, die gibt es eigentlich schon ... ist
bloß nie veröffentlicht worden, weil zu technisch
und zu kleine Zielgruppe und so ...
Viele Grüße
Michael