Hi Rolf,
Mit Wartung meinste jetzt das updaten der Indexdatei.
Ja.
Hmm rekapitulieren, wenn folgende Probleme auf einen Streich erledigt werden sollen:
- Broken Links zu mittlerweile archivierten Postings!
- Suche der Links auf archivierte Postings.
- Suche der Links auf Selfhtml-Kapitel.
brauchen wir Indexdateien mit folgenden infos:
In diesem Detaillierungsgrad solltest Du das Ergebnis unbedingt bei
SourceForge abladen. Mein bug report behandelt ja etwas Ähnliches.
so wie ich das sehe gibts 3 Ansätze:
- Das Forumsskript trägt Links in die Indexdatei ein
- Erst beim archivieren werden Links in die Indexdatei eingetragen
- In Intervallen wird mit der Archivsuche die Indexdatei
aktualisiert.
Siehe meinen bug report: Aufgrund der unvorhersehbaren Reihenfolge der
dynamisch ausgelösten Thread-Archivierungsvorginge funktioniert leider
nichts von 1. und 2. ohne zusätzliche Verwaltungslogik, denke ich.
Macht Sinn, aber war nicht eh ne neue Suche in der mache?
Eben. Deshalb SourceForge - die müssen eh das plugin-API darauf abstimmen.
Also wenn ich das autark am SELFteam vorbei realisieren wollte, würd ich deine
Suchmaschine mit entsprechenden REgExp füttern, auf "Ausführliche Trefferanzeige"
gehen und basta. (das hab ich aber nicht vor)
Keinen site grabber auf den jeweiligen Archiv-Monat?
Hmm du meinst den ganzen Monat runterladen?
Ich meine "das gesamte Archiv spiegeln, mit minimalem Traffic".
Quasi einen "caching archive beautifier".
Es ist doch eh angekündigt das die neue Forumssuche aktuelle Postings
miterfasst, spricht dafür gleich Variante 1 der Indexgenerierung
mitzuerschlagen.
Es wäre ein Wunsch von mir.
Von "angekündigt" weiß ich nicht wirklich etwas ...
Jetzt im Ernst: mehrdeutige Adressierungen müssen beim durchsuchen
auf ein Standardformat normiert und so abgelegt werden.
Erst beim Durchsuchen? Nicht vielleicht schon beim Archivieren?
Kaputte referenzen sind doch schon zu hauf archiviert.
Altlasten wegen inkompatiblen Änderungen hätten durch Konverter repariert
werden können.
Bezüglich Tippfehlern bei Eingaben hätte sowohl ein Posting-Previewer als
auch ein online-HTTP-HEAD-Check auf den URL die broken-link-Anzahl des
Archivs drastisch reduzieren können. Beides sind offene feature requests.
Ich fänds am saubersten wenns nur eine normierte/transparente Adressierung
gäbe:
sowas wie http://forum.de.selfhtml.org/?m=20449
muß ausreichen um das Teil zu finden egal ob archiviert oder nicht.
Ich würde sogar auf relative Adressierung herunter gehen.
Das Ideal das das Archiv runtergeladen werden kann ist doch bereits
aufgegeben worden, oder?
Ein site grabber bekommt es mühelos.
Es wird nur nicht mehr der Service supported, fertige ZIP files anzubieten.
Viel Grüße
Michael