molily: Posting im Archiv nicht auffindbar <dau />

Hallo zusammen,

äußerst befremdlich, ich stecke in einem sehr seltsamen Problem fest. Vor einigen Monaten (August oder September, schätze ich) schrieb ich ein Posting, welches eine Parodie auf die Forderungen nach einer stärkeren Regulierung des Selfforums war, es stellte eine Art Usenet-artige RfD dar. Das Eigenartige ist, dass ich den Artikel im Archiv nicht wiederfinden kann, obwohl ich genau weiß, was darin stand. Meiner Erinnerung nach habe ich ihn schon mehrmals im Archiv wiedergefunden, beispielsweise als ich alle meine Postings der letzten Monate noch einmal las.

Meine Erinnerungen sind wie folgt (alles AFAIK):

Themenbereich: (ZU DIESEM FORUM);q=0.8 (MENSCHELEI)
Themenname: Petition OR Forumsadministration
Absendername: Mathias Schäfer;q=0.2 molily
Relativ sichere Keywords aus dem Postingkörper:
 Proponent
 Mathias
 Schäfer
 molily@gmx.de
 Selfhtml
 Forum
 Linksetzerkollektiv
Mögliche Keywords aus dem Postingkörper:
 Führungskader
 Begründung

Weiterhin bin ich mir absolut sicher, dass ich das Posting mit GnuPG signiert hatte, dadurch dürfte die Nachricht folgendermaßen umrandet sein:

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

...
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.0 (MingW32)

[blafasel]
-----END PGP SIGNATURE-----

Die GnuPG-Version dürfte damals 1.0.x gewesen sein, aber das ist nicht entscheidend, das MingW32 und der Rest sollte eindeutig genug sein.

Kurioserweise finde ich über die Suche unter keinem der eindeutigen Schlüsselwörter das Posting, auch eine beliebige Kombination ergibt kein Ergebnis... Google hat den Thread offensichtlich auch nicht indiziert.

Nicht dass ich das Posting unbedingt brauche oder dass es sonstwie wichtig oder gehaltvoll ist, aber mich interessiert schon, wo es geblieben ist.
Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich, kann ich das saugen[tm] und beispielsweise mit grep malträtieren? Oder darf ich die entsprechenden Archivordner rekursiv wgetten...?

Danke im Voraus für die Entwirrung... vielleicht hat der Linksetzer etwas passendes. *g*

Grüße,
Mathias

--
Geschwisterzwist zwischen Slivovic schlürfenden, spitzen, twistenden und schwitzenden Zwitscherschwestern.
Zwanzig Zwerge zeigen Handstand, zehn im Wandschrank, zehn am Sandstrand.
Kalle Kahlekatzenglatzenkratzer kratzt kahle Katzenglatzen.
Bietet Brunhilde berauschende Brüste, buhlt Bodo brünstig beim Balle.
  1. Hallo molily,

    äußerst befremdlich, ich stecke in einem sehr seltsamen
    Problem fest.

    So seltsam ist das gar nicht. Bis ca. 8 oder 9 Uhr laeuft
    der Indexer. Und der legt die Index-Datei fuer das Jahr 2002
    immer komplett neu an (hat verschiedene Gruende, die ich hier
    nicht erlaeutern will). Und wenn du zu der Zeit suchst, wirst
    du halt einige Postings (logischerweise) nicht finden.

    Ueberigens: </archiv/2002/10/25904/#m142806>

    Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich,

    Das ist eine (uralte) Index-Datei fuer die Suche.

    kann ich das saugen[tm] und beispielsweise mit grep
    malträtieren?

    Sicher.

    Oder darf ich die entsprechenden Archivordner rekursiv
    wgetten...?

    Ungern, der Archiv-Viewer kostet immer noch sehr viele
    Ressourcen. Ich muss den echt mal ersetzen...

    Gruesse,
     CK

    1. Hi Christian,

      Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich,
      kann ich das saugen[tm] und beispielsweise mit grep
      malträtieren?
      Sicher.

      die wird allerdings nicht gerade klein sein, zumal sie ziemlich sicher _nicht_ in komprimierter Form ausgeliefert werden dürfte ...

      Viele Grüße
            Michael

      --
      T'Pol: I meant no insult.
      V'Lar: Of course not. You're simply speaking your mind ... as you always have.
      1. Hallo Michael,

        Was hat es eigentlich mit /archiv/sfa_idx.txt auf sich,
        kann ich das saugen[tm] und beispielsweise mit grep
        malträtieren?

        Da wir gerade dabei sind: Warum kann man sich das (neue) Archiv eigentlich nicht mehr direkt als ZIP runterladen? Zu viel Traffic?

        Grüße,

        Christian

        --
        Sollen sich alle schämen, die gedankenlos sich der Wunder der Wissenschaft und Technik bedienen und nicht mehr davon erfasst haben als eine Kuh von der Botanik der Pflanzen, die sie mit Wohlbehagen frisst.
                              -- Albert Einstein
        1. Hallo Christian,

          Da wir gerade dabei sind: Warum kann man sich das (neue)
          Archiv eigentlich nicht mehr direkt als ZIP runterladen? Zu
          viel Traffic?

          Das neue Archiv liegt nur in XML-Form vor. Es muss erst ein
          HTML-Generator geschrieben werden. Das soll mit dem neuen
          Archiv-Viewer geschehen.

          Gruesse,
           CK

          1. Hallo Christian,

            Das neue Archiv liegt nur in XML-Form vor.

            Für mich persönlich wäre das kein Problem, ich könnte ja einen XSLT-Prozessor drüber laufen lassen...

            Es muss erst ein
            HTML-Generator geschrieben werden. Das soll mit dem neuen
            Archiv-Viewer geschehen.

            Das verstehe ich jetzt nicht so ganz, warum soll der neue Archiv-Viewer außer der Ausgabe, die er an den Browser schickt, noch zusätzlich HTML-Dokumente produzieren?

            Grüße,

            Christian

            --
            Sollen sich alle schämen, die gedankenlos sich der Wunder der Wissenschaft und Technik bedienen und nicht mehr davon erfasst haben als eine Kuh von der Botanik der Pflanzen, die sie mit Wohlbehagen frisst.
                                  -- Albert Einstein
            1. Hallo Christian,

              Es muss erst ein
              HTML-Generator geschrieben werden. Das soll mit dem neuen
              Archiv-Viewer geschehen.

              Das verstehe ich jetzt nicht so ganz, warum soll der neue
              Archiv-Viewer außer der Ausgabe, die er an den Browser
              schickt, noch zusätzlich HTML-Dokumente produzieren?

              Von http://cforum.teamone.de/:

              fo_arcview

              [...]
                * Download-Versionen vom Archiv

              Gruesse,
               CK

              1. Hallo Christian,

                Von http://cforum.teamone.de/:

                fo_arcview

                [...]
                  * Download-Versionen vom Archiv

                ähhhh, ok, jetzt dürft ihr mich steinigen...

                Grüße,

                Christian

                --
                Sollen sich alle schämen, die gedankenlos sich der Wunder der Wissenschaft und Technik bedienen und nicht mehr davon erfasst haben als eine Kuh von der Botanik der Pflanzen, die sie mit Wohlbehagen frisst.
                                      -- Albert Einstein
    2. Hallo, Christian,

      äußerst befremdlich, ich stecke in einem sehr seltsamen
      Problem fest.

      So seltsam ist das gar nicht. Bis ca. 8 oder 9 Uhr laeuft
      der Indexer. Und der legt die Index-Datei fuer das Jahr 2002
      immer komplett neu an (hat verschiedene Gruende, die ich hier
      nicht erlaeutern will). Und wenn du zu der Zeit suchst, wirst
      du halt einige Postings (logischerweise) nicht finden.

      Welcher Index wird denn dann benutzt, der des Vortags? Wieso finde ich dann ein Monate altes Posting nicht, weil nur im bereits bearbeiteten Index gesucht wird, das heißt zu der frühen Stunde beispielsweise nur die ersten Monate des Jahres durchsuchbar waren? Oder meintest du ein Wort-/Volltextindex? (Verzeihe, ich bin über die Funktionsweise der Suche nicht informiert... sollte besser die Threads über das Suchmodell verfolgen.)

      Ich verstehe es immer noch nicht, beziehungsweise ich kann es mir nicht erklären, denn ich probiere seit ich dein Posting heute nachmittag gelesen hatte, das Posting über die genannten Suchbegriffe wiederzufinden, bekomme aber immer Null Resultate, genau wie heute früh morgens.

      "Zuwiderhandlungen" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Zuwiderhandlungen&lang=on&feld=alle&index_4=on&hits=alle -> Posting ist nicht unter den Rsultaten
      "Linksetzerkollektiv" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
      "Führungskader" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=f�hrungskader&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
      "Hilfsbedürftigen" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Hilfsbed�rftigen&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate
      "begin pgp signature" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=BEGIN+PGP+SIGNATURE&lang=on&feld=alle&index_4=on&hits=alle -> Posting ist nicht unter den Resultaten

      Und so weiter... ich habe es dutzendmal in allen möglichen Kombinationen probiert, schon bevor ich diesen Thread gestartet habe. Selbst wenn ich nach allen Postings von "molily" suche, finde ich das Posting nicht. Den Thread kann ich übrigens auch nicht wiederfinden. Bitte sagt mir, dass ich irgendetwas Selbstverständliches übersehen habe...

      Wann wäre denn eine Zeit, in der man das Archiv vollständig durchsuchen kann...?

      Ueberigens: </archiv/2002/10/25904/#m142806>

      Viel mehr interessiert mich, *wie* du ihn wiedergefunden hast... Okay, "du bist root, du darfst das"[tm], die Möglichkeiten habe ich nicht...

      [/archiv/sfa_idx.txt]

      Dort habe ich das Posting übrigens auch nicht gefunden, scheinbar ist die Datei auch nicht aktuell, das heißt enthält das Posting gar nicht. Ich kann nicht hineinschauen, da ich nicht weiß, wie ich die letzte Zeile lesen kann *schäm*.

      Grüße,
      Mathias

      --
      Geschwisterzwist zwischen Slivovic schlürfenden, spitzen, twistenden und schwitzenden Zwitscherschwestern.
      Zwanzig Zwerge zeigen Handstand, zehn im Wandschrank, zehn am Sandstrand.
      Kalle Kahlekatzenglatzenkratzer kratzt kahle Katzenglatzen.
      Bietet Brunhilde berauschende Brüste, buhlt Bodo brünstig beim Balle.
      1. Hallo Mathias,

        Ueberigens: </archiv/2002/10/25904/#m142806>

        *rotfl*
        Wie habe ich es geschafft, _den_ zu übersehen?

        Grüße
        Andreas

      2. Hi molily,

        (Verzeihe, ich bin über die Funktionsweise der Suche nicht informiert... sollte besser die Threads über das Suchmodell verfolgen.)

        der entsprechende Thread geht über reichlich futuristische Aspekte, die hoffentlich in einigen Monaten implementiert und produktiv sein werden.
        Bisher ist die Suche im Wesentlichen ein "advanced grep", nicht (viel) mehr und nicht weniger.

        [/archiv/sfa_idx.txt]

        Für das Verständnis der laufenden Suche ist dies hier die richtige Datei - sowohl semantisch (d. h. zum Verständnis des Datenmodells) als auch syntaktisch (was da nicht drin steht, findet such.pl auch nicht - egal, durch welches Problem beim Indexen das vor langer Zeit passiert sein mag).

        scheinbar ist die Datei auch nicht aktuell, das heißt enthält das Posting gar nicht. Ich kann nicht hineinschauen, da ich nicht weiß, wie ich die letzte Zeile lesen kann *schäm*.

        Auf welchem Betriebssystem arbeitest Du? ("tail" etc.; die ganze Datei in einen Editor zu laden wäre in der Tat ein netter Belastungstest für Deinen Rechner ...).

        Viele Grüße
              Michael

        --
        T'Pol: I meant no insult.
        V'Lar: Of course not. You're simply speaking your mind ... as you always have.
        1. Hallo, Michael,

          [/archiv/sfa_idx.txt]

          scheinbar ist die Datei auch nicht aktuell, das heißt enthält das Posting gar nicht. Ich kann nicht hineinschauen, da ich nicht weiß, wie ich die letzte Zeile lesen kann *schäm*.

          Auf welchem Betriebssystem arbeitest Du? ("tail" etc.; die ganze Datei in einen Editor zu laden wäre in der Tat ein netter Belastungstest für Deinen Rechner ...).

          *g* Meine Editoren verkraften das natürlich nicht, beziehungsweise mein System. Ein PHP-Script hat nicht gewirkt (ich weiß nicht, wie ich ich die Datei von hinten lese, fopen() etc. erlauben solche Dateioperationen nicht, sie sind offensichtlich nicht hardwarenah genug), aber mit tail unter Cygwin geht es.
          Die letzte Nachricht ist allerdings aus dem April 2000, ist der aktuelle Index auch downloadbar? Siehe auch Christians Frage [pref:t=31409&m=170453].

          Btw, wieso zeigt eigentlich das Suchskript von Zeit zu Zeit unterschiedliche Größen für das 2002er-Archiv an? Das heißt, manchmal wird der Wert kleiner (sic).

          Grüße,
          Mathias

          --
          Geschwisterzwist zwischen Slivovic schlürfenden, spitzen, twistenden und schwitzenden Zwitscherschwestern.
          Zwanzig Zwerge zeigen Handstand, zehn im Wandschrank, zehn am Sandstrand.
          Kalle Kahlekatzenglatzenkratzer kratzt kahle Katzenglatzen.
          Bietet Brunhilde berauschende Brüste, buhlt Bodo brünstig beim Balle.
          1. Hallo Mathias,

            Ein PHP-Script hat nicht gewirkt (ich weiß nicht, wie ich ich die Datei von hinten lese, fopen() etc. erlauben solche Dateioperationen nicht, sie sind offensichtlich nicht hardwarenah genug),

            <linksetzer>
            http://php3.de/de/fseek
            </linksetzer>

            Grüße,

            Christian

            --
            Sollen sich alle schämen, die gedankenlos sich der Wunder der Wissenschaft und Technik bedienen und nicht mehr davon erfasst haben als eine Kuh von der Botanik der Pflanzen, die sie mit Wohlbehagen frisst.
                                  -- Albert Einstein
          2. Hallo molily,

            Die letzte Nachricht ist allerdings aus dem April 2000, ist
            der aktuelle Index auch downloadbar? Siehe auch Christians
            Frage [pref:t=31409&m=170453].

            Nein.

            Btw, wieso zeigt eigentlich das Suchskript von Zeit zu Zeit
            unterschiedliche Größen für das 2002er-Archiv an? Das heißt,
            manchmal wird der Wert kleiner (sic).

            Wie gesagt: der Index wird jeden Tag neu erstellt.

            Gruesse,
             CK

        2. Hallo Michael,

          Auf welchem Betriebssystem arbeitest Du? ("tail" etc.; die
          ganze Datei in einen Editor zu laden wäre in der Tat ein
          netter Belastungstest für Deinen Rechner ...).

          Kommt auf den Editor drauf an ;) Ein vi(m) wuerde nur Teile der
          Datei im Speicher halten.

          Gruesse,
           CK

      3. Hallo molily,

        Welcher Index wird denn dann benutzt, der des Vortags?

        Nur ein Teil-Index. Der, der eben schon fertig ist ;)

        Wieso finde ich dann ein Monate altes Posting nicht, weil
        nur im bereits bearbeiteten Index gesucht wird, das heißt
        zu der frühen Stunde beispielsweise nur die ersten Monate
        des Jahres durchsuchbar waren?

        Richtig.

        Ich verstehe es immer noch nicht, beziehungsweise ich kann
        es mir nicht erklären, denn ich probiere seit ich dein
        Posting heute nachmittag gelesen hatte, das Posting über
        die genannten Suchbegriffe wiederzufinden, bekomme aber
        immer Null Resultate, genau wie heute früh morgens.

        http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=100

        gibt mir genau einen Treffer: dein Posting.

        "Zuwiderhandlungen"
        http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Zuwiderhandlungen&lang=on&feld=alle&index_4=on&hits=alle
        -> Posting ist nicht unter den Rsultaten

        Doch. Direkt zweiter Treffer. Der Titel ist 'Bitte melde
        dich'.

        "Linksetzerkollektiv" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate

        1 Resultat.

        Wann wäre denn eine Zeit, in der man das Archiv
        vollständig durchsuchen kann...?

        9:00 Uhr (oder so) bis 5:00 Uhr.

        Ueberigens: </archiv/2002/10/25904/#m142806>

        Viel mehr interessiert mich, *wie* du ihn wiedergefunden
        hast... Okay, "du bist root, du darfst das"[tm], die
        Möglichkeiten habe ich nicht...

        Ueber die Suche, Suchausdruck: Linksetzerkollektiv.

        Gruesse,
         CK

        1. Hallo, Christian,

          "Linksetzerkollektiv" http://selfsuche.teamone.de/cgi-bin/such.pl?suchausdruck=Linksetzerkollektiv&lang=on&feld=alle&index_4=on&hits=alle -> Null Resultate

          1 Resultat.

          Gemein! Ich schwöre[tm], als ich mehrmals gesucht habe, gab es keine Resultate, und zwar außerhalb der von dir genannten Indizierungsphasen, wie gesagt... jetzt geht es plötzlich. *grmbl*

          Viel mehr interessiert mich, *wie* du ihn wiedergefunden
          hast...

          Ueber die Suche, Suchausdruck: Linksetzerkollektiv.

          Ihr spielt mir sicher einen Streich, ihr wollt mich zum Wahnsinn bringen! ;)
          Zu Hülf, da dringen Leute in mein Haus ein, sie wollen mich mitnehmen, in eine Zwangsjacke stecken, helft miaaaaaaargh.... *fg*

          Mathias

          --
          Geschwisterzwist zwischen Slivovic schlürfenden, spitzen, twistenden und schwitzenden Zwitscherschwestern.
          Zwanzig Zwerge zeigen Handstand, zehn im Wandschrank, zehn am Sandstrand.
          Kalle Kahlekatzenglatzenkratzer kratzt kahle Katzenglatzen.
          Bietet Brunhilde berauschende Brüste, buhlt Bodo brünstig beim Balle.
          1. Hi molily,

            Gemein! Ich schwöre[tm], als ich mehrmals gesucht habe, gab es keine Resultate, und zwar außerhalb der von dir genannten Indizierungsphasen, wie gesagt... jetzt geht es plötzlich. *grmbl*

            bist Du sicher, daß Du die korrekte Groß/Kleinschreibung verwendet hast?
            Diese Checkbox ist im Formular per Default gesetzt (aus Performance-Gründen).

            Viele Grüße
                  Michael

            --
            T'Pol: I meant no insult.
            V'Lar: Of course not. You're simply speaking your mind ... as you always have.
            1. Hallo, Michael,

              Gemein! Ich schwöre[tm], als ich mehrmals gesucht habe, gab es keine Resultate, und zwar außerhalb der von dir genannten Indizierungsphasen, wie gesagt... jetzt geht es plötzlich. *grmbl*

              bist Du sicher, daß Du die korrekte Groß/Kleinschreibung verwendet hast?

              Ja, bin ich. Ich hatte alle Möglichkeiten mehrmals ausprobiert, mit der Einstellung in beiden Varianten und ohne die Option in beiden Varianten, und noch einigen andere Varianten, mit den verschiedenen Suchbegriffen.

              Ich habe ja die direkten Suchoptionen verlinkt, ob ich mich vertippt hatte oder auf etwas nicht geachtet hatte, ist nicht entscheidend, denn exakt mit diesen Parametern erhielt ich null Resultate und jetzt ein Resultat beziehungweise unter anderen Resultaten das gewünschte Posting.

              Diese Checkbox ist im Formular per Default gesetzt (aus Performance-Gründen).

              Ich starte meine Suche i.d.R. von einem eigenen Formular aus, in welchem diese Option nicht gesetzt ist. Natürlich habe ich bei den Tests das Originalformular benutzt beziehungsweise die GET-Parameter von Hand übergeprüft, um einen eventuellen Fehler zu finden. Wie gesagt, mit exakt gleichen Parametern war die Ausgabe zu einer Zeit, in welcher keine Indizierung vorgenommen wird, unterschiedlich.

              Grüße,
              Mathias

              --
              Mein Leben, ein Leben ist es kaum, / Ich gehe dahin als wie im Traum.
              Wie Schatten huschen die Mensch hin, / Ein Schatten dazwischen ich selber bin.
              Und im Herzen tiefe Müdigkeit - / Alles sagt mir: Es ist Zeit ...
              (Theodor Fontane, Mein Leben)