Kess: (ZU DIESEM FORUM) Nochmal als eigener Thread: Archivsuche erweitern um SelfHTML und Forum-Auslese

Beitrag lesen

Hallo Michael.

Du kritisierst die bestehende Lösung, ohne die Aufgabenstellung zu formulieren. Und die lautet bisher einfach "Volltextsuche", nach beliebigen Phrasen. Deshalb wird ja auch der Volltext geindext.

Bitte beruhige Dich. Es lag mir fern, das bestehende - und super laufende - Script oder Dich zu kritisieren. So möchte ich diese Diskussion nicht verstandenen haben.
Jede Software unterliegt einem Lebenszyklus. Und da ohnehin über das Thema diskutiert wird, kann man auch gleich darüber nachdenken, ob das Script auch künftig den Anforderungen genügt. Es sollte ein Vorschlag sein. Mehr nicht.

Bei der Menge der Daten aus Selfhtml habe ich mich verschätzt. Aber bei der Menge der künftig zu erwartenden Forumsbeiträge denke ich nicht, daß sie zurückgehen werden. So sehe ich schon, daß bald Handlungsbedarf entstehen wird. Mit bald meine ich nicht heute oder morgen oder nächste Woche aber doch einen absehbaren Zeitraum.

Den Volltextindex wollte ich nicht angegriffen wissen. Mein Vorschlag sollte eine Altermative zur Diskussion (!) stellen.

Es gibt eine Aussage von Stefan zu diesem Thema: Auch der bisherige Indexer konnte das schon mal, und die Ersparnis war nicht signifikant.

Jepp. Wobei Stefan von einem Volltextindex ausging und ich von einem Schlagwortindex. Ein kleiner Unterschied :-)

Eben, das ist das Problem: Du implementierst damit eine Suchmethode, für die überhaupt keine Eingabedaten vorhanden sind.

Nein. Ich wollte damit ein Konzept aufzeigen in einer solchen DB beide Strukturen, Doku unbd Forum zu vereinen. die Referenzen zu Selfhtml brauchen z.B. weder Autor noch Datum jeweils mitzuführen.

Eine Abbildung des SelfHTML-Formats auf das semantische Konzept des Postings hat Stefan geliefert. An dieser Stelle gewinnen wir also nichts im Ergebnis.

Verlieren aber auch nichts.
Oder gewinnen wir doch ? *grübel* So fit bin ich jetzt mit der jetzigen Suche nicht. Ist es möglich zu fragen nach Autor Muenz und Titel enthält 'Frame' und Text enthält 'Resolution' ?
ich glaube nicht. Mit einer DB im Hintergrund wäre das kein Problem.

Auf den Hauptvorteil bist Du allerdings gar nicht eingegangen: Der Index wird nicht nur kleiner, sondern vor allem ein Baum!

Sorry, wenn ich von einer DB spreche, dann spreche ich von einer rightigen DB, z.B. Oracle. Das habe ich einfach vorausgesetzt. Das ist Teil meiner täglichen Arbeit und damit für mich vielleicht schon allzu selbstverständlich geworden.

Da ist dann nix mehr mit rechtzeitig abbrechen ...

Jein. Je nach DB kann man Row- und Runtimebeschränkungen vorgeben :-)

Und was macht wohl der AND-Operator im aktuellen Such-Skript, bitte sehr? Wieso habe ich den eingebaut, wenn Du das nicht mal bemerkt hast? Gnlpfts ...

Calm down. ;-)
Ich sprach von echten Phrasen. Also 'Vorschlag zum Forum' und nicht 'Vorschlag' AND 'zum' AND 'Forum'. Die Jetzige Suche beherrscht so etwas, mein Vorschlag würde solche Phrasen nicht beherrschen.

Mit den Forumdateien ist es genauso. Ein Vollindexlauf wäre lästig, aber machbar.

Das ist mir klar. Noch einmal. Es geht mir nicht darum, das bestehende Script schlecht zu machen. Ich wolte eine DB-basierte Alternative aufzeigen. Eben weil die Antwortzeiten langsam aber deutlich ansteigen.

Irgendwie sehe ich im Moment keinen zwingenden Grund für den Datenbankansatz ... nicht, daß er mir keinen Spaß machen würde, weit gefehlt ...

Well, endlich sind wir bei der Diskussion. :-)
Das ist letzlich nämlich die Frage: Macht es Sinn oder nicht. Imho ist es momentan vielleicht noch nicht unbedingt zwingend aber es macht Sinn.

Viele Grüße
Kess