Posting im Archiv nicht auffindbar <dau />
molily
- zu diesem forum
Hallo zusammen,
äußerst befremdlich, ich stecke in einem sehr seltsamen Problem fest. Vor einigen Monaten (August oder September, schätze ich) schrieb ich ein Posting, welches eine Parodie auf die Forderungen nach einer stärkeren Regulierung des Selfforums war, es stellte eine Art Usenet-artige RfD dar. Das Eigenartige ist, dass ich den Artikel im Archiv nicht wiederfinden kann, obwohl ich genau weiß, was darin stand. Meiner Erinnerung nach habe ich ihn schon mehrmals im Archiv wiedergefunden, beispielsweise als ich alle meine Postings der letzten Monate noch einmal las.
Meine Erinnerungen sind wie folgt (alles AFAIK):
Themenbereich: (ZU DIESEM FORUM);q=0.8 (MENSCHELEI)
Themenname: Petition OR Forumsadministration
Absendername: Mathias Schäfer;q=0.2 molily
Relativ sichere Keywords aus dem Postingkörper:
Proponent
Mathias
Schäfer
molily@gmx.de
Selfhtml
Forum
Linksetzerkollektiv
Mögliche Keywords aus dem Postingkörper:
Führungskader
Begründung
Weiterhin bin ich mir absolut sicher, dass ich das Posting mit GnuPG signiert hatte, dadurch dürfte die Nachricht folgendermaßen umrandet sein:
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
...
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.0 (MingW32)
[blafasel]
-----END PGP SIGNATURE-----
Die GnuPG-Version dürfte damals 1.0.x gewesen sein, aber das ist nicht entscheidend, das MingW32 und der Rest sollte eindeutig genug sein.
Kurioserweise finde ich über die Suche unter keinem der eindeutigen Schlüsselwörter das Posting, auch eine beliebige Kombination ergibt kein Ergebnis... Google hat den Thread offensichtlich auch nicht indiziert.
Nicht dass ich das Posting unbedingt brauche oder dass es sonstwie wichtig oder gehaltvoll ist, aber mich interessiert schon, wo es geblieben ist.
Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich, kann ich das saugen[tm] und beispielsweise mit grep malträtieren? Oder darf ich die entsprechenden Archivordner rekursiv wgetten...?
Danke im Voraus für die Entwirrung... vielleicht hat der Linksetzer etwas passendes. *g*
Grüße,
Mathias
Hallo molily,
äußerst befremdlich, ich stecke in einem sehr seltsamen
Problem fest.
So seltsam ist das gar nicht. Bis ca. 8 oder 9 Uhr laeuft
der Indexer. Und der legt die Index-Datei fuer das Jahr 2002
immer komplett neu an (hat verschiedene Gruende, die ich hier
nicht erlaeutern will). Und wenn du zu der Zeit suchst, wirst
du halt einige Postings (logischerweise) nicht finden.
Ueberigens: </archiv/2002/10/25904/#m142806>
Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich,
Das ist eine (uralte) Index-Datei fuer die Suche.
kann ich das saugen[tm] und beispielsweise mit grep
malträtieren?
Sicher.
Oder darf ich die entsprechenden Archivordner rekursiv
wgetten...?
Ungern, der Archiv-Viewer kostet immer noch sehr viele
Ressourcen. Ich muss den echt mal ersetzen...
Gruesse,
CK
Hi Christian,
Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich,
kann ich das saugen[tm] und beispielsweise mit grep
malträtieren?
Sicher.
die wird allerdings nicht gerade klein sein, zumal sie ziemlich sicher _nicht_ in komprimierter Form ausgeliefert werden dürfte ...
Viele Grüße
Michael
Hallo Michael,
Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich,
kann ich das saugen[tm] und beispielsweise mit grep
malträtieren?
Da wir gerade dabei sind: Warum kann man sich das (neue) Archiv eigentlich nicht mehr direkt als ZIP runterladen? Zu viel Traffic?
Grüße,
Christian
Hallo Christian,
Da wir gerade dabei sind: Warum kann man sich das (neue)
Archiv eigentlich nicht mehr direkt als ZIP runterladen? Zu
viel Traffic?
Das neue Archiv liegt nur in XML-Form vor. Es muss erst ein
HTML-Generator geschrieben werden. Das soll mit dem neuen
Archiv-Viewer geschehen.
Gruesse,
CK
Hallo Christian,
Das neue Archiv liegt nur in XML-Form vor.
Für mich persönlich wäre das kein Problem, ich könnte ja einen XSLT-Prozessor drüber laufen lassen...
Es muss erst ein
HTML-Generator geschrieben werden. Das soll mit dem neuen
Archiv-Viewer geschehen.
Das verstehe ich jetzt nicht so ganz, warum soll der neue Archiv-Viewer außer der Ausgabe, die er an den Browser schickt, noch zusätzlich HTML-Dokumente produzieren?
Grüße,
Christian
Hallo Christian,
Es muss erst ein
HTML-Generator geschrieben werden. Das soll mit dem neuen
Archiv-Viewer geschehen.Das verstehe ich jetzt nicht so ganz, warum soll der neue
Archiv-Viewer außer der Ausgabe, die er an den Browser
schickt, noch zusätzlich HTML-Dokumente produzieren?
Von http://cforum.teamone.de/:
[...]
* Download-Versionen vom Archiv
Gruesse,
CK
Hallo Christian,
Von http://cforum.teamone.de/:
fo_arcview
[...]
* Download-Versionen vom Archiv
ähhhh, ok, jetzt dürft ihr mich steinigen...
Grüße,
Christian
Hallo, Christian,
äußerst befremdlich, ich stecke in einem sehr seltsamen
Problem fest.So seltsam ist das gar nicht. Bis ca. 8 oder 9 Uhr laeuft
der Indexer. Und der legt die Index-Datei fuer das Jahr 2002
immer komplett neu an (hat verschiedene Gruende, die ich hier
nicht erlaeutern will). Und wenn du zu der Zeit suchst, wirst
du halt einige Postings (logischerweise) nicht finden.
Welcher Index wird denn dann benutzt, der des Vortags? Wieso finde ich dann ein Monate altes Posting nicht, weil nur im bereits bearbeiteten Index gesucht wird, das heißt zu der frühen Stunde beispielsweise nur die ersten Monate des Jahres durchsuchbar waren? Oder meintest du ein Wort-/Volltextindex? (Verzeihe, ich bin über die Funktionsweise der Suche nicht informiert... sollte besser die Threads über das Suchmodell verfolgen.)
Ich verstehe es immer noch nicht, beziehungsweise ich kann es mir nicht erklären, denn ich probiere seit ich dein Posting heute nachmittag gelesen hatte, das Posting über die genannten Suchbegriffe wiederzufinden, bekomme aber immer Null Resultate, genau wie heute früh morgens.
"Zuwiderhandlungen" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Zuwiderhandlungen&lang=on&feld=alle&index_4=on&hits=alle -> Posting ist nicht unter den Rsultaten
"Linksetzerkollektiv" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
"Führungskader" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=f�hrungskader&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
"Hilfsbedürftigen" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Hilfsbed�rftigen&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
"begin pgp signature" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=BEGIN+PGP+SIGNATURE&lang=on&feld=alle&index_4=on&hits=alle -> Posting ist nicht unter den Resultaten
Und so weiter... ich habe es dutzendmal in allen möglichen Kombinationen probiert, schon bevor ich diesen Thread gestartet habe. Selbst wenn ich nach allen Postings von "molily" suche, finde ich das Posting nicht. Den Thread kann ich übrigens auch nicht wiederfinden. Bitte sagt mir, dass ich irgendetwas Selbstverständliches übersehen habe...
Wann wäre denn eine Zeit, in der man das Archiv vollständig durchsuchen kann...?
Ueberigens: </archiv/2002/10/25904/#m142806>
Viel mehr interessiert mich, *wie* du ihn wiedergefunden hast... Okay, "du bist root, du darfst das"[tm], die Möglichkeiten habe ich nicht...
[/archiv/sfa_idx.txt]
Dort habe ich das Posting übrigens auch nicht gefunden, scheinbar ist die Datei auch nicht aktuell, das heißt enthält das Posting gar nicht. Ich kann nicht hineinschauen, da ich nicht weiß, wie ich die letzte Zeile lesen kann *schäm*.
Grüße,
Mathias
Hallo Mathias,
Ueberigens: </archiv/2002/10/25904/#m142806>
*rotfl*
Wie habe ich es geschafft, _den_ zu übersehen?
Grüße
Andreas
Hi molily,
(Verzeihe, ich bin über die Funktionsweise der Suche nicht informiert... sollte besser die Threads über das Suchmodell verfolgen.)
der entsprechende Thread geht über reichlich futuristische Aspekte, die hoffentlich in einigen Monaten implementiert und produktiv sein werden.
Bisher ist die Suche im Wesentlichen ein "advanced grep", nicht (viel) mehr und nicht weniger.
[/archiv/sfa_idx.txt]
Für das Verständnis der laufenden Suche ist dies hier die richtige Datei - sowohl semantisch (d. h. zum Verständnis des Datenmodells) als auch syntaktisch (was da nicht drin steht, findet such.pl auch nicht - egal, durch welches Problem beim Indexen das vor langer Zeit passiert sein mag).
scheinbar ist die Datei auch nicht aktuell, das heißt enthält das Posting gar nicht. Ich kann nicht hineinschauen, da ich nicht weiß, wie ich die letzte Zeile lesen kann *schäm*.
Auf welchem Betriebssystem arbeitest Du? ("tail" etc.; die ganze Datei in einen Editor zu laden wäre in der Tat ein netter Belastungstest für Deinen Rechner ...).
Viele Grüße
Michael
Hallo, Michael,
[/archiv/sfa_idx.txt]
scheinbar ist die Datei auch nicht aktuell, das heißt enthält das Posting gar nicht. Ich kann nicht hineinschauen, da ich nicht weiß, wie ich die letzte Zeile lesen kann *schäm*.
Auf welchem Betriebssystem arbeitest Du? ("tail" etc.; die ganze Datei in einen Editor zu laden wäre in der Tat ein netter Belastungstest für Deinen Rechner ...).
*g* Meine Editoren verkraften das natürlich nicht, beziehungsweise mein System. Ein PHP-Script hat nicht gewirkt (ich weiß nicht, wie ich ich die Datei von hinten lese, fopen() etc. erlauben solche Dateioperationen nicht, sie sind offensichtlich nicht hardwarenah genug), aber mit tail unter Cygwin geht es.
Die letzte Nachricht ist allerdings aus dem April 2000, ist der aktuelle Index auch downloadbar? Siehe auch Christians Frage [pref:t=31409&m=170453].
Btw, wieso zeigt eigentlich das Suchskript von Zeit zu Zeit unterschiedliche Größen für das 2002er-Archiv an? Das heißt, manchmal wird der Wert kleiner (sic).
Grüße,
Mathias
Hallo Mathias,
Ein PHP-Script hat nicht gewirkt (ich weiß nicht, wie ich ich die Datei von hinten lese, fopen() etc. erlauben solche Dateioperationen nicht, sie sind offensichtlich nicht hardwarenah genug),
<linksetzer>
http://php3.de/de/fseek
</linksetzer>
Grüße,
Christian
Hallo molily,
Die letzte Nachricht ist allerdings aus dem April 2000, ist
der aktuelle Index auch downloadbar? Siehe auch Christians
Frage [pref:t=31409&m=170453].
Nein.
Btw, wieso zeigt eigentlich das Suchskript von Zeit zu Zeit
unterschiedliche Größen für das 2002er-Archiv an? Das heißt,
manchmal wird der Wert kleiner (sic).
Wie gesagt: der Index wird jeden Tag neu erstellt.
Gruesse,
CK
Hallo Michael,
Auf welchem Betriebssystem arbeitest Du? ("tail" etc.; die
ganze Datei in einen Editor zu laden wäre in der Tat ein
netter Belastungstest für Deinen Rechner ...).
Kommt auf den Editor drauf an ;) Ein vi(m) wuerde nur Teile der
Datei im Speicher halten.
Gruesse,
CK
Hallo molily,
Welcher Index wird denn dann benutzt, der des Vortags?
Nur ein Teil-Index. Der, der eben schon fertig ist ;)
Wieso finde ich dann ein Monate altes Posting nicht, weil
nur im bereits bearbeiteten Index gesucht wird, das heißt
zu der frühen Stunde beispielsweise nur die ersten Monate
des Jahres durchsuchbar waren?
Richtig.
Ich verstehe es immer noch nicht, beziehungsweise ich kann
es mir nicht erklären, denn ich probiere seit ich dein
Posting heute nachmittag gelesen hatte, das Posting über
die genannten Suchbegriffe wiederzufinden, bekomme aber
immer Null Resultate, genau wie heute früh morgens.
gibt mir genau einen Treffer: dein Posting.
"Zuwiderhandlungen"
http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Zuwiderhandlungen&lang=on&feld=alle&index_4=on&hits=alle
-> Posting ist nicht unter den Rsultaten
Doch. Direkt zweiter Treffer. Der Titel ist 'Bitte melde
dich'.
"Linksetzerkollektiv" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
1 Resultat.
Wann wäre denn eine Zeit, in der man das Archiv
vollständig durchsuchen kann...?
9:00 Uhr (oder so) bis 5:00 Uhr.
Ueberigens: </archiv/2002/10/25904/#m142806>
Viel mehr interessiert mich, *wie* du ihn wiedergefunden
hast... Okay, "du bist root, du darfst das"[tm], die
Möglichkeiten habe ich nicht...
Ueber die Suche, Suchausdruck: Linksetzerkollektiv.
Gruesse,
CK
Hallo, Christian,
"Linksetzerkollektiv" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
1 Resultat.
Gemein! Ich schwöre[tm], als ich mehrmals gesucht habe, gab es keine Resultate, und zwar außerhalb der von dir genannten Indizierungsphasen, wie gesagt... jetzt geht es plötzlich. *grmbl*
Viel mehr interessiert mich, *wie* du ihn wiedergefunden
hast...Ueber die Suche, Suchausdruck: Linksetzerkollektiv.
Ihr spielt mir sicher einen Streich, ihr wollt mich zum Wahnsinn bringen! ;)
Zu Hülf, da dringen Leute in mein Haus ein, sie wollen mich mitnehmen, in eine Zwangsjacke stecken, helft miaaaaaaargh.... *fg*
Mathias
Hi molily,
Gemein! Ich schwöre[tm], als ich mehrmals gesucht habe, gab es keine Resultate, und zwar außerhalb der von dir genannten Indizierungsphasen, wie gesagt... jetzt geht es plötzlich. *grmbl*
bist Du sicher, daß Du die korrekte Groß/Kleinschreibung verwendet hast?
Diese Checkbox ist im Formular per Default gesetzt (aus Performance-Gründen).
Viele Grüße
Michael
Hallo, Michael,
Gemein! Ich schwöre[tm], als ich mehrmals gesucht habe, gab es keine Resultate, und zwar außerhalb der von dir genannten Indizierungsphasen, wie gesagt... jetzt geht es plötzlich. *grmbl*
bist Du sicher, daß Du die korrekte Groß/Kleinschreibung verwendet hast?
Ja, bin ich. Ich hatte alle Möglichkeiten mehrmals ausprobiert, mit der Einstellung in beiden Varianten und ohne die Option in beiden Varianten, und noch einigen andere Varianten, mit den verschiedenen Suchbegriffen.
Ich habe ja die direkten Suchoptionen verlinkt, ob ich mich vertippt hatte oder auf etwas nicht geachtet hatte, ist nicht entscheidend, denn exakt mit diesen Parametern erhielt ich null Resultate und jetzt ein Resultat beziehungweise unter anderen Resultaten das gewünschte Posting.
Diese Checkbox ist im Formular per Default gesetzt (aus Performance-Gründen).
Ich starte meine Suche i.d.R. von einem eigenen Formular aus, in welchem diese Option nicht gesetzt ist. Natürlich habe ich bei den Tests das Originalformular benutzt beziehungsweise die GET-Parameter von Hand übergeprüft, um einen eventuellen Fehler zu finden. Wie gesagt, mit exakt gleichen Parametern war die Ausgabe zu einer Zeit, in welcher keine Indizierung vorgenommen wird, unterschiedlich.
Grüße,
Mathias