Hallo Stefan und Michael,
wo ist mein Posting von heute morgen hin ? *gmpf* Habe ich das alles in die Luft geschrieben ???
Also noch mal:
Ich denke, und das wißt ihr sicher auch selber :-), eine Erweiterung der Suche auf Selfhtml und die Forumsauslese würde riesige Indexdateien bedeuten.
Eine Aufteilung der Dateien nach Jahren mag kurzfristig Abbhilfe schaffen, ist aber eine zusammengemauschelte Lösung. Wenn ich mir die Tendenz dieses Forums ansehe, wird dieses Jahr alleine vermutlich so viel Aufkommen bringen, wie 1998 und 1999 zusammen. Bald teilen wir die Indexfiles dann nach Halbjahren, und dann nach ...
Auch müßten die Indices über Selfhtml wohl nach Themengebiet geteilt werden. Und wenn ich dann mal über die gesamte Site suchen möchte ? ... Die Antwortzeiten mag ich mir gar nicht ausmalen.
Bei dem Umfang kommt man an einer Datenbank gar nicht vorbei. Es muß nicht gleich eine 100.000 DM Lösung sein. Erst einmal sollte man ein Konzept entwickeln und DANN wird die passende DB und notfalls auch der passende Provider dazu gesucht.
Damit es nicht heißt 'Ist ja alles ganz schön und gut, aber ...' hier gleich eine erste Überlegung für ein solges Konzept.
Fangen wir mal mit der Volltextsuche an. Der umfangreichste Teil. Bisher enthält der Index die Referenz, Datum, Autor, Titel, Text, ...
Mit jedem Posting nimmt der Umfang des Indix-Files um eben die Menge geposteter Daten zu. Zu viel!
Eine Datenbank könnte folgendermaßen aufgebaut sein:
Tabelle Files - Spalten Fileindex, Pfad und Datei
Tabelle Struktur - Spalten Titel, Datum, Topic, Autor, Fileindex, ...
wobei einige Spalten durchaus nullable sind.
Tabelle Schlagworte - Spalten Begriff, Indexliste
Selfhtml, die Auslese und das Archiv bleiben erhalten wie sie sind. Was ersetzt würde, wären die Indexdateien. Jede Datei wird mit einem Index versehen und in Tabelle Files eingetragen. Die Tabelle Struktur ist denke ich klar.
In Schlagworte werden alle Begriffe abzüglich allgemeiner Worte, wie 'der', 'die', 'das', 'dem', 'und', 'aber' usw. eingetragen - inklusive Varianten. Jedoch jeder Begriff nur einmal.
In der Spalte Indexliste werden alle Fileindices eingetragen, in denen der Begriff auftaucht. Wer mit Datenbanken vertrut ist, weiß, worauf ich hinauswill. Nicht nur, daß die Indices deutlich kleiner würden, die Struktur läßt auch eine beliebige Tiefe der Referenzierung zu. Thread, Posting, Thema, Unterthema, Anker ...
einziges Manko: eine Volltextsuche nach Phrasen ist nicht mehr möglich. Doch kann man die Features auch zu weit treiben. Immerhin kann man nach allen Wörtern gleichzeitig suchen. Aus diesem Grund werden auch die Titel nicht in die Tabelle Schlagworte eingefügt, sondern in die Tabelle Struktur. An eine Wortkombination im Titel erinnert man sich viel leichter.
Die Datenbank könnte jederzeit aus den bestehenden Files neu aufgebaut werden oder eben nur um weitere Forumsbeiträge erweitert werden.
Die Suche kann alternativ nach Titel, Thema, Autor usw. oder/und als Volltextsuche erfolgen. Habe ich etwas vergessen ?
Um das aufzubauen, brauchen wir bei den hier vorhandenen Kenntnissen doch sicher keinen kostenpflichtigen Support ... ?
Viele Grüße
Kess