XaraX: Anfrage an die Forumsbetreiber

Guten Morgen!

hiermit möchte ich die Erlaubnis erbitten, das Froumsarchiv (vorerst) teilweise zu spiegeln und zum Download anzubieten.
Dies ergibt sich aus [pref:t=82117&m=478018] von Tom.

Diese Nacht habe ich bereitz angefangen Teile für mich privat offline verfügbar zu machen und würde auch meine nächsten Nachtschichten dafür nutzen, um den regulären Archivbetrieb nicht zu stören.

Desweiteren würde ich diesen zu einem späteren Zeitpunkt mit einer Downloadobergrenze von 400 GB/Monat anbieten wollen, so mir dies erlaubt sei.

Gruß aus Berlin!
eddi

  1. Holladiewaldfee,

    Desweiteren würde ich diesen zu einem späteren Zeitpunkt mit einer Downloadobergrenze von 400 GB/Monat anbieten wollen, so mir dies erlaubt sei.

    Das sind bei 450Mb Archivgröße grademal 900 und ein paar zerquetschte Downloads ... die dürftest Du nach drei oder vier Tage weghaben ;-)
    Deswegen würde ich Dir zu Raiks Vorschlag raten, das Ding über BitTorrent oder eDonkey zu verteilen. Da sind die 400Gb wesentlich effizienter aufgehoben.

    Ansonsten finde ich die Idee nicht schlecht, auch wenn das Archiv meiner Ansicht nach ohne eine Möglichkeit zum Durchsuchen eher wertlos ist. Die Unmengen von Wissen, die darin versteckt liegen, sind unter einer Unmenge trivialem Kram begraben.

    Irgendwie müsste also eine Art Grobauswahl getroffen werden, im Stil der alten Archivauslese. Und daß das ein Jahrhundertprojekt ist, an das sich hier keiner wirklich rantraut, respektive daß die, die es probieren, auf die Nase fallen, hat sich ja schon gezeigt.

    Ciao,

    Harry

    --
      Bald kommt die Waldfee ... (Projektphase: Layout)
      Bis dahin:
      http://harry.ilo.de/projekte/berge/
    1. Holla fee,

      Desweiteren würde ich diesen zu einem späteren Zeitpunkt mit einer Downloadobergrenze von 400 GB/Monat anbieten wollen, so mir dies erlaubt sei.

      Das sind bei 450Mb Archivgröße grademal 900 und ein paar zerquetschte Downloads ... die dürftest Du nach drei oder vier Tage weghaben

      Es ist mir klar, das es nur ein Anfang sein kann. Jedoch komme ich auf eine ganz andere Zahl, da sich bis jetzt die Dowloadmasse auf 15% als tar.gz komprimieren lässt demnach wären es rund 3000, was immer schon was ist!

      Deswegen würde ich Dir zu Raiks Vorschlag raten, das Ding über BitTorrent oder eDonkey zu verteilen. Da sind die 400Gb wesentlich effizienter aufgehoben.

      Werde ich mir ansehen und mich drumm kümmern.

      Ansonsten finde ich die Idee nicht schlecht, auch wenn das Archiv meiner Ansicht nach ohne eine Möglichkeit zum Durchsuchen eher wertlos ist. Die Unmengen von Wissen, die darin versteckt liegen, sind unter einer Unmenge trivialem Kram begraben.

      Hilfe gesucht: Wer kann daraus ein .chm (Hilfearchiv) bauen?

      Irgendwie müsste also eine Art Grobauswahl getroffen werden, im Stil der alten Archivauslese. Und daß das ein Jahrhundertprojekt ist, an das sich hier keiner wirklich rantraut, respektive daß die, die es probieren, auf die Nase fallen, hat sich ja schon gezeigt.

      Bisjetzt filtere ich (auch aus eigenen Interesse für die Sprache) alle Inhalte mit deklarierem Bezug zu PHP herraus. Das ist aber auf jedes andere Gebiet auch möglich. Daher halte ich eine Auslese nicht für nötig, wenn sich jeder seine Themengebiete selbst per Download zusammenstellen kann.

      Gruß aus Berlin!
      eddi

      1. Hi XaraX

        Das sind bei 450Mb Archivgröße grademal 900 und ein paar zerquetschte Downloads ... die dürftest Du nach drei oder vier Tage weghaben

        Es sind, bis etwa Mitte April, 1.4 GB Daten in unkomprimierter Form und irgendwas zwischen 200 und 400 MB entpackt.

        Gruss Daniela

        1. Hallo.

          Es sind, bis etwa Mitte April, 1.4 GB Daten in unkomprimierter Form und irgendwas zwischen 200 und 400 MB entpackt.

          Siehst du die Fragezeichen über meinem Kopf aufsteigen?
          MfG, at

  2. Hallo,

    hiermit möchte ich die Erlaubnis erbitten, das Froumsarchiv (vorerst) teilweise zu spiegeln und zum Download anzubieten.

    damit bin ich, in meiner Eigenschaft als Forumsteilnehmer, nicht ein-
    verstanden. Weder möchte ich, dass meine archivierten Postings außer-
    halb des Selfraumes gespiegelt auftauchen, noch halte ich eine Down-
    loadmöglichkeit des Archivs außerhalb des Selfraumes für akzeptabel.

    Es tut mir leid, dass ich damit vermutlich dieses Vorhaben zunichte
    mache, aber ich denke, es sollte auch legitim sein, einen derartigen
    Wunsch zu äußern.

    Viele Grüße,
    Stefan

    1. damit bin ich, in meiner Eigenschaft als Forumsteilnehmer, nicht ein-
      verstanden.

      Ack

    2. Holladiewaldfee Stefan,

      Weder möchte ich, dass meine archivierten Postings außer-
      halb des Selfraumes gespiegelt auftauchen

      Du solltest an Google schreiben ... sie cachen Deine Postings, außerhalb des Selfraumes. Oder Du solltest an Stefan Münz / Christian / sonstwen schreiben ... er soll Bots verbieten, das Archiv zu durchforsten.

      noch halte ich eine Down-
      loadmöglichkeit des Archivs außerhalb des Selfraumes für akzeptabel.

      Selfraum = self*.teamone.de?

      Ciao,

      Harry

      --
        Bald kommt die Waldfee ... (Projektphase: Layout)
        Bis dahin:
        http://harry.ilo.de/projekte/berge/
      1. Hallo,

        Du solltest an Google schreiben ... sie cachen Deine Postings, außerhalb des Selfraumes.

        die Rede ist nicht vom Cache einzelner Postings, sondern einer
        Spiegelung des gesamten Archives. Sowas gibt es m.W. derzeit
        nicht und ich habe ein Interesse daran, dass es so bleibt.

        Oder Du solltest an Stefan Münz / Christian / sonstwen schreiben ... er soll Bots verbieten, das Archiv zu durchforsten.

        Halte ich für wenig sinnvoll, warum sollten Google-Nutzer nicht
        mehr alte Forumsbeiträge als Suchergebnisse erhalten, wenn darin
        die Lösung für ihr Problem steht?

        Selfraum = self*.teamone.de?

        zzgl. *.selfhtml.org

        Viele Grüße,
        Stefan

        1. Holladiewaldfee,

          Du solltest an Google schreiben ... sie cachen Deine Postings, außerhalb des Selfraumes.

          die Rede ist nicht vom Cache einzelner Postings, sondern einer
          Spiegelung des gesamten Archives. Sowas gibt es m.W. derzeit
          nicht und ich habe ein Interesse daran, dass es so bleibt.

          Wenn jetzt beschlossen werden sollte, das Archiv wieder zum Download, hier auf self*.teamone.de, anzubieten, wäre das ok? Wegen seiner Größe müsste dieses Archiv dann aber auch gespiegelt werden. Wenn nun jemand anderes, mit ausdrücklicher Zustimmung der Verantwortlichen, diese Idee umsetzt und im Sinne des Self-Gedankens von seinem eigenen Server zum Download anbietet ... wäre das auch ok? Anscheinend nicht. Wo aber liegt denn der Unterschied zu obigem?

          Ich erkenne da keinen, außer, daß es jemand anderes macht und die Arbeit nicht die Devs machen müssen. Solange derjenige, der das tut, nicht versucht, daraus in irgendeiner Form Kapital zu schlagen, halte ich das eigentlich für unbedenklich. Letzteres muß natürlich ganz klar Auflage sein.

          Oder Du solltest an Stefan Münz / Christian / sonstwen schreiben ... er soll Bots verbieten, das Archiv zu durchforsten.

          Halte ich für wenig sinnvoll, warum sollten Google-Nutzer nicht
          mehr alte Forumsbeiträge als Suchergebnisse erhalten, wenn darin
          die Lösung für ihr Problem steht?

          Ich hatte das im Zusammenhang mit dem Caching durch Google gedacht.

          Ciao,

          Harry

          --
            Bald kommt die Waldfee ... (Projektphase: Layout)
            Bis dahin:
            http://harry.ilo.de/projekte/berge/
          1. Hallo,

            Wenn jetzt beschlossen werden sollte, das Archiv wieder zum Download, hier auf self*.teamone.de, anzubieten, wäre das ok? Wegen seiner Größe müsste dieses Archiv dann aber auch gespiegelt werden. Wenn nun jemand anderes, mit ausdrücklicher Zustimmung der Verantwortlichen, diese Idee umsetzt und im Sinne des Self-Gedankens von seinem eigenen Server zum Download anbietet ... wäre das auch ok?

            meine Bedenken beziehen sich in erster Linie auf die Spiegelung,
            wenn die Download-Möglichkeit mit dem Hinweis angeboten wird, dass
            diese Daten nicht für die Veröffentlichung im WWW gedacht sind, ist
            es imho ok. Auch wenn diese ZIP-Files außerhalb des Selfraumes ab-
            gelegt werden, hier sollte allerdings ein Hinweis stehen, dass die
            alternative Download-Möglichkeit offiziell ist.

            Ein Offline-Variante des Archives, in welcher Form auf immer, würde
            ich auf jeden Fall begrüßen. Notfalls als exe-Datei, die kann dann
            niemand im WWW weiterveröffentlichen ;-)

            Viele Grüße,
            Stefan

            1. Hallo,

              wenn die Download-Möglichkeit mit dem Hinweis angeboten wird, dass
              diese Daten nicht für die Veröffentlichung im WWW gedacht sind,

              Hab ich was verpasst? Ich dachte, wenn man etwas zum Download anbietet,
              hat man es veröffentlicht?

              Ein Offline-Variante des Archives, in welcher Form auf immer, würde
              ich auf jeden Fall begrüßen.

              Ich auch, die könnte man schneller durchsuchen.

              Gruß
              Alexander Brock

              --
              Selfcode: ss:{ zu:| ls:# fo:| de:] va:) ch:? sh:( n4:? rl:? br:> js:) ie:{ fl:| mo:}
              http://emmanuel.dammerer.at/selfcode.html
              Deshalb können Pinguine nicht fliegen:
              Was nicht fliegt kann auch nicht abstürzen
              1. Hallo Alexander,

                Hab ich was verpasst? Ich dachte, wenn man etwas zum Download anbietet,
                hat man es veröffentlicht?

                naja, habe ich mich etwas eigenartig ausgedrückt. Ich meinte es in
                etwa so ... es gibt eine Adresse im Selfraum oder eine offiziell
                authorisierte Adresse außerhalb des Selfraumes, von wo man sich
                das Archiv komprimiert runterladen kann, dort steht groß und deut-
                lich der Hinweis, dass es nicht gestattet ist, diese Daten im Web
                (unkomprimiert oder komprimiert) zu veröffentlichen. Damit wäre
                gewährleistet, dass die Download-Dateien wirklich ok sind und es
                gäbe auch weiterhin nur eine Online-Version des Forumsarchives.

                Viele Grüße,
                Stefan

                1. Moin,

                  naja, habe ich mich etwas eigenartig ausgedrückt. Ich meinte es in
                  etwa so ... es gibt eine Adresse im Selfraum oder eine offiziell
                  authorisierte Adresse außerhalb des Selfraumes, von wo man sich
                  das Archiv komprimiert runterladen kann, dort steht groß und deut-
                  lich der Hinweis, dass es nicht gestattet ist, diese Daten im Web
                  (unkomprimiert oder komprimiert) zu veröffentlichen. Damit wäre
                  gewährleistet, dass die Download-Dateien wirklich ok sind und es
                  gäbe auch weiterhin nur eine Online-Version des Forumsarchives.

                  Stefan, ich verstehe immer weniger, was genau Du möchtest, was genau Dein Bedenken ist. Ich möchte das aber wissen. Deshalb frage ich noch einmal nach:
                  Deine Befürchtung ist also, dass verschiedene "inoffizielle" Mirrors dazu führen könnten, inkonsistente Daten (z.B. fehlende oder verfälschte Threads) ausliefern oder "kaputte" Archive existieren. Oder anders herum: Es geht Dir nicht um Dein Recht auf informationelle Selbstbestimmtheit. Ist das so richtig?

                  Viele Grüße

                  Swen Wacker

              2. Holladiewaldfee,

                Ein Offline-Variante des Archives, in welcher Form auf immer, würde
                ich auf jeden Fall begrüßen.

                Ich auch, die könnte man schneller durchsuchen.

                Dann will ich mich doch gleich mal unbeliebt machen und hiermit CHM als Format vorschlagen ;-)

                Ciao,

                Harry

                --
                  Bald kommt die Waldfee ... (Projektphase: Layout)
                  Bis dahin:
                  http://harry.ilo.de/projekte/berge/
                1. Hallo Harry

                  Dann will ich mich doch gleich mal unbeliebt machen und hiermit CHM als Format vorschlagen ;-)

                  Damit das Archiv nur mit dem IE verwendet werden kann?

                  MFG
                  Detlef

                  --
                  - Wissen ist gut
                  - Können ist besser
                  - aber das Beste und Interessanteste ist der Weg dahin!
    3. Moin,

      Es tut mir leid, dass ich damit vermutlich dieses Vorhaben zunichte
      mache, aber ich denke, es sollte auch legitim sein, einen derartigen
      Wunsch zu äußern.

      Wir hatten dieses Thema hier schon öfters. Ich persönlich glaube nicht, dass Du hierauf überhaupt einen Rechtsanspruch hast; und wenn ja, dann hättet Du ihn m.E. verwirkt, da Dir bewusst ist, dass Postings archiviert und von Suchmaschinen indiziert werden.

      Wir sollten hier aber aufhören, mit unseren allenfalls halbjuristischen Wissen Vermutungen anzustellen, wer hier welchen Anspruch hat oder nicht. Ich werde noch heute einen Brief an den Datenschutzbeauftragten des Landes Schleswig-Holstein schreiben und diesen bitten, uns mitzuteilen welchen Grenzen und Möglichkeiten bei der Archivierung und/oder Auswertung von Postings in einen öffentlich zugänglichen aber gleichwohl privatem Forum bestehen.

      Ich bin dann für etwas mehr als eine Woche im Urlaub. Dann melde ich mich wieder.

      Viele Grüße

      Swen Wacker

      1. Hallo Swen,

        Ich persönlich glaube nicht, dass Du hierauf überhaupt einen Rechtsanspruch hast; und wenn ja, dann hättet Du ihn m.E. verwirkt, da Dir bewusst ist, dass Postings archiviert und von Suchmaschinen indiziert werden.

        Postings hier im Selfraum archivieren, von Suchmaschinen indizieren
        (und ggf. cachen) lassen oder woanders das Archiv als Spiegel ab-
        legen, sind für mich ganz verschiedene Sachen. Die Indizierung durch
        Suchmaschinen gab es von Anfang an, ebenso die Archivierung, es gab
        auch mal zwei Spiegel des alten Archivs, die sind wieder weg, was
        ich sehr begrüße. Von Rechtsanspruch o.ä. habe ich bewußt nicht
        geredet, dafür kenne ich mich auf diesem Gebiet zuwenig aus und
        ich finde es auch ziemlich daneben, wenn wir jetzt solche Keulen
        auspacken, nur um zu klären, ob ja oder nein. Es steht der Wunsch
        von Forumsteilnehmern im Raum, die mit einer Spiegelung der alten
        Beiträge außerhalb des Selfraumes nicht einverstanden sind.

        Wir sollten hier aber aufhören, mit unseren allenfalls halbjuristischen Wissen Vermutungen anzustellen, wer hier welchen Anspruch hat oder nicht.

        Auf das Thema "Rechtsanspruch" hast Du eben erst diesen Thread ge-
        bracht, vorher hat davon niemand gesprochen.

        Ich werde noch heute einen Brief an den Datenschutzbeauftragten des Landes Schleswig-Holstein schreiben und diesen bitten, uns mitzuteilen welchen Grenzen und Möglichkeiten bei der Archivierung und/oder Auswertung von Postings in einen öffentlich zugänglichen aber gleichwohl privatem Forum bestehen.

        Mit der Archivierung der alten Postings habe ich kein Problem,
        ebenso mit dem redaktionellen Auswerten der Beiträge (wie die
        Forumsauslese früher).

        Nun nehmen wir mal an, der Datenschutzbeauftragte oder wer auch
        immer auf diesem Gebiet hinreichend kundige, bestätigt, dass die
        Spiegelung eines Forumsarchives außerhalb des dazugehörigen Web-
        Angebotes zulässig ist. Was passiert dann?

        Ehrlich gesagt finde ich es schade, dass die Diskussion jetzt auf
        einmal so in den rechtlichen Bereich geht. Ist der Wunsch, dass
        die archivierten Beiträge nur hier online verfügbar sein sollen,
        nicht ausreichend, muß sowas wirklich rechtlich geklärt werden?

        Viele Grüße,
        Stefan

        1. Moin,

          Von Rechtsanspruch o.ä. habe ich bewußt nicht geredet[...]

          Du schriebst in Deinem Ausgangsposting::
          "... damit bin ich, in meiner Eigenschaft als Forumsteilnehmer, nicht einverstanden. Weder möchte ich, dass meine archivierten Postings außerhalb des Selfraumes gespiegelt auftauchen, noch halte ich eine Downloadmöglichkeit des Archivs außerhalb des Selfraumes für akzeptabel.

          Es tut mir leid, dass ich damit vermutlich dieses Vorhaben zunichte
          mache, aber ich denke, es sollte auch legitim sein, einen derartigen
          Wunsch zu äußern."

          Wenn das nicht die Erhebung eines Rechtsanspruchs ist, was dann? Im übrigen halte ich die Datenschützer der Länder für sensibel genug, nicht nur auf der Basis von Rechten oder Nicht zu argumentieren sonder auch Hinweise über den Umgang mit Daten "unterhalb" von Rechtsansprüchen zu geben.

          Mehrere Forumsbesucher wollen etwas machen. Du sagst, dass Du eben das nicht willst und drückst Dein Bedauern darüber aus, dass damit (also mit der Beachtung Deiner Forderung) der Wunsch der anderen Forumsteilnehmer nicht realisiert werden könne. Es stehen sich zwei Meinungen (Wünsche) gegenüber. Sollte es nicht auch in Deinem Interesse sein zu klären, ob Deine Meinung mehr Gewicht hat als die der anderen? Ich kann nicht Verwerfliches daran entdecken, wenn ich eine kompetente Stelle fragen möchte, ob die ja nicht nur von Dir erhobene Forderung nun besonderes Gewicht hat oder nicht. Ich denke auch, dass dies die Meinungsbildung der Betreiber weiter bringen könnte. Auf jeden Fall hat es aber nichts damit zu tun, Dich eine böse Ecke stellen zu wollen.

          Nun nehmen wir mal an, der Datenschutzbeauftragte oder wer auch
          immer auf diesem Gebiet hinreichend kundige, bestätigt, dass die
          Spiegelung eines Forumsarchives außerhalb des dazugehörigen Web-
          Angebotes zulässig ist. Was passiert dann?

          Ich denke: Nichts. Sollte es nicht zulässig sein, wüsstest Du, dass Du dagegen angehen kannst.

          Viele Grüße

          Swen Wacker

          1. Hallo,

            das überrollt mich jetzt - ich hatte ja kein Ahnung, welche Diskusion ich entfachen würde. Auch muß ich mir eingestehen, bin ich wohl sehr naiv mit den rechtlichen Aspekten (wie dem Recht auf Datenschutz) umgesprungen. Jeder kann sich das Archiv in seiner jetzigen Form ja selbst downloaden; nur reicht es nicht, wenn es einer tut (es gehört schon ein gewaltiges Stück Überredungskunst dazu dem Server jede Seite zu entlocken) und andern die Mühen erspart?

            Nichts desto Trotz will ich keinen übergehen und akzeptiere den Wunsch von Stefan, als ihn zu übergehen.

            Wer in der Vergangenheit mit dem Archiv gearbeitet hat, weiß sicher selbst, das jede Entlastung letztendlich allen nur zu gute kommen sollte. Dahin gehend waren jedenfalls meine Überlegungen.
            Es war angedacht das Achriv als ganzes und in Themengebieten gegliedert auf einen Server neutral abzulegen, um den regelmäßigen Forumsteilnehmern eine weitere Möglichkeit, im Archiv (offline) stöbern zu können, anzubieten.
            Wer aber genau überlegt, wird feststellen, daß die Kapazität von 400 GB/Monat nicht im mindesten ausrechen dürfte!

            Wenn ich es richtig verstehe, liegt jedoch der Hund in einer Vermutung begraben, denn aus:

            "...Weder möchte ich, dass meine archivierten Postings außerhalb des Selfraumes gespiegelt auftauchen, noch halte ich eine Downloadmöglichkeit des Archivs außerhalb des Selfraumes für akzeptabel. ..."

            • entnehme ich nicht die Angst nach verletztem Datenschutz sondern die Vermutung dem Gedanken der SelfCommunity etwas wegnehmen zu wollen - oder gar Profit daraus zu schlagen. Dagegen kann ich hier nun anreden wie ich will - es wird niemanden umstimmen - daher lasse ich es.
              Stattdessen werde ich mich nach dieser Diskusion mit SELFHTLM e. V. versuchen eine Lösung zu finden, denn einfach nur die Mitgliedschaft, dürfte sicher wohl nicht allein ausreichen den angesprochenen Selfraum in Stefans Augen um meine Person zu erweitern.

            Gruß aus Berlin!
            eddi

            1. Moin,

              das überrollt mich jetzt - ich hatte ja kein Ahnung, welche Diskusion ich entfachen würde.

              Das ist normal hier :-) Ist doch besser, als sich anzuschweigen, oder? :-)

              Jeder kann sich das Archiv in seiner jetzigen Form ja selbst downloaden; nur reicht es nicht, wenn es einer tut (es gehört schon ein gewaltiges Stück Überredungskunst dazu dem Server jede Seite zu entlocken) und andern die Mühen erspart?

              Eben. Dieses Argument finde ich ja bedenkenswert, solange es keine anderen, sachlichen Argumente gegen das Angebot gibt. Es spart ja Traffic, wenn gepackte Archive nicht (nur) hier, sondern anderswo bzw. anderswie angeboten werden. Über inkonsistente Daten braucht man sich ja bei den meisten Lösungen keine Gedanken machen, da z.B. EMule- oder EDonkey-Links (und wohl auch Bittorrent-Tracker, da kenn ich mich nicht so aus) eineindeutig sind. Und die Prüfsumme (CRC32?)in zip- oder rar-Dateien sollte den gleichen Effekt erfüllen können, oder?

              Viele Grüße

              Swen Wacker

              1. Hallo.

                das überrollt mich jetzt - ich hatte ja kein Ahnung, welche Diskusion ich entfachen würde.
                Das ist normal hier :-) Ist doch besser, als sich anzuschweigen, oder? :-)

                Das Funktionsprinzip heißt "Forum" ;-)
                MfG, at

                1. Hallo at, hallo Swen,

                  einiges hatte ich in betracht gezogen; Diskusionen über

                  - den Bedarf oder Nichtbedarf
                   - die geringe Verfügbarkeit
                   - Offlinedurchsuchbarkeit
                   - Übertragungswege der Daten

                  Aber daß sich eine Diskusion anbahnen würde, wie der Überschrift zu entnehmen ist über Datenschutz und m. E. darin eindeutig ist, hat mich völlig überrollt, da nicht erwartet.

                  Dennoch ist auch das ein zu beleuchtender Aspekt und ich stimme Swen absolut zu, daß hier ein Zustimmen durch Schweigen nicht gewollt sein kann.

                  In diesem Sinne könnte ein Entfernen aller E-Mail-Adressen und über die Angabe des Datums hinausgehenden Zeiten eine Lösung sein.

                  Gruß aus Berlin!
                  eddi

                  1. Hi Eddi,

                    - den Bedarf oder Nichtbedarf

                    Bedarf nach eine guten Durchsuchbarkeit besteht, keine Frage. Diese sollte jedoch online und somit aktuell sein.

                    - die geringe Verfügbarkeit

                    Das wird nicht ewig so bleiben. Die neuen Server sind in Sichtweite und Daniela klingt bezüglich der neuen Suche sehr optimistisch.

                    - Offlinedurchsuchbarkeit

                    Das halte ich für problematisch, siehe unten.

                    Aber daß sich eine Diskusion anbahnen würde, wie der Überschrift zu entnehmen ist über Datenschutz und m. E. darin eindeutig ist, hat mich völlig überrollt, da nicht erwartet.

                    Das ist womöglich tatsächlich rechtlich problematisch. Aus einem vollständigen Archiv ließen sich Nutzerprofile ermitteln. Da ist es mir dann doch lieber, die Admins zu kennen und zu wissen, dass da kein Schindluder getrieben wird. Es wird wohl nicht möglich sein, alle personenrelevanten Daten aus den Postings zu entfernen.

                    In diesem Sinne könnte ein Entfernen aller E-Mail-Adressen und über die Angabe des Datums hinausgehenden Zeiten eine Lösung sein.

                    Wie willst du Namen usw. aus den Postings selbst entfernen? Manuell? :-)

                    Grüße,
                     Roland

                    1. Hi Orlando,

                      Das wird nicht ewig so bleiben. Die neuen Server sind in Sichtweite und Daniela klingt bezüglich der neuen Suche sehr optimistisch.

                      Damit wäre das Gesuch gegenstandslos.

                      • Offlinedurchsuchbarkeit

                      Das halte ich für problematisch, siehe unten.

                      Die Problematik besteht genauer betrachtet nicht, da jeder mit einem Server seine eigenen Scripte nutzen wird und diejeniegen, die dies nicht können / nicht wollen, haben durch Hilfearchive eine weitere Möglichkeit.
                      Dem Gedanke ansich scheint zugrunde zu liegen, daß es das Archiv nur als .chm gäbe (zumal ich mir noch nicht einmal angesehen habe, wie sich dies realisieren lassen würde).

                      Das ist womöglich tatsächlich rechtlich problematisch. Aus einem vollständigen Archiv ließen sich Nutzerprofile ermitteln. Da ist es mir dann doch lieber, die Admins zu kennen und zu wissen, dass da kein Schindluder getrieben wird. Es wird wohl nicht möglich sein, alle personenrelevanten Daten aus den Postings zu entfernen.

                      Das Archiv ist vollständig abrufbar und ich kopiere es grade mit einem flotten 13zeiler. Demnach besteht also diese Möglichkeit auch schon jetz und steht nicht für das http://forum.de.selfhtml.org/my/archiv/ im Wege (dies anmerkend, wohlaber der rechtlichen Problematik nunmehr bewußt).

                      In diesem Sinne könnte ein Entfernen aller E-Mail-Adressen und über die Angabe des Datums hinausgehenden Zeiten eine Lösung sein.

                      Wie willst du Namen usw. aus den Postings selbst entfernen? Manuell? :-)

                      Bis jetzt hat das mein fleißiger Sklave getan und solange der User namens wwwrun mit meinen 13 Zeilen die Inhalte nach PHP-relevats prüft und abspeichert, kann er das auch mit 2-3 Zeilen mehr auch gleich übernehmen.
                      Die Frage war jetzt aber nicht wirklich ernst; oder?

                      Gruß aus Berlin!
                      eddi

                      1. Hi Eddi,

                        Das Archiv ist vollständig abrufbar und ich kopiere es grade mit einem flotten 13zeiler.

                        Dafür ist es nicht gedacht. Wenn du willst, werden wir das zunächst einmal intern diskutieren und dir dann bei einer positiven Entscheidung das Archiv in geeigneter Form zukommen lassen. Es ist absolut nicht notwendig, den Archiv-Viewer (es handelt sich _nicht_ um statische Seiten) hunderttausende Male zu beanspruchen und den Server mit derart vielen Requests zu bombardieren.

                        Demnach besteht also diese Möglichkeit auch schon jetz und steht nicht für das http://forum.de.selfhtml.org/my/archiv/ im Wege (dies anmerkend, wohlaber der rechtlichen Problematik nunmehr bewußt).

                        Wenn ein Download gewünscht wäre, gäbe es ein entsprechendes Angebot.

                        Wie willst du Namen usw. aus den Postings selbst entfernen? Manuell? :-)

                        Bis jetzt hat das mein fleißiger Sklave getan und solange der User namens wwwrun mit meinen 13 Zeilen die Inhalte nach PHP-relevats prüft und abspeichert, kann er das auch mit 2-3 Zeilen mehr auch gleich übernehmen.

                        Wie?

                        Die Frage war jetzt aber nicht wirklich ernst; oder?

                        Absolut ernst.

                        Grüße,
                         Roland

                        1. Re:

                          Das Archiv ist vollständig abrufbar und ich kopiere es grade mit einem flotten 13zeiler.

                          Dafür ist es nicht gedacht. Wenn du willst, werden wir das zunächst einmal intern diskutieren und dir dann bei einer positiven Entscheidung das Archiv in geeigneter Form zukommen lassen.

                          Darum bitte ich nicht nur für mich, sondern auch für Tom [pref:t=82117&m=478018].

                          Es ist absolut nicht notwendig, den Archiv-Viewer (es handelt sich _nicht_ um statische Seiten) hunderttausende Male zu beanspruchen und den Server mit derart vielen Requests zu bombardieren.

                          Das ist mir klar, daher ist es, wie im Ausgangsposting zu sehen ist, auch nur zwischen 0:00 und 6:00 angedacht, um den regulären Archivbetrieb nicht zu stören.

                          Wenn ein Download gewünscht wäre, gäbe es ein entsprechendes Angebot.

                          [pref:t=82117&m=478018] und jeder Andere, der neue Tutorials erstellen will.
                          |

                          Bis jetzt hat das mein fleißiger Sklave getan und solange der User namens wwwrun mit meinen 13 Zeilen die Inhalte nach PHP-relevats prüft und abspeichert, kann er das auch mit 2-3 Zeilen mehr auch gleich übernehmen.

                          Wie?

                          Wenn Du es wirklich wissen willst (ich werde das Script nicht posten, wegen der oben von dir genannten Mißbrauchsmöglichkeiten) mailto:eddi@s166.deinprovider.de

                          Die Frage war jetzt aber nicht wirklich ernst; oder?

                          Absolut ernst.

                          Der Viewer generiert tadellosen Code, der von Archivnummer zu Archivnummer identisch ist. Damit ist das HTML ohne großen rechenaufwand (Reguläre Ausdrücke) ein sehrgut leserliches Datenblatt, also wenn Du so willst, lassen sich sich sogar verschidene Methoden von XML eins zu eins anwenden.

                          Gruß aus Berlin!
                          eddi

                          1. Moin!

                            Es ist absolut nicht notwendig, den Archiv-Viewer (es handelt sich _nicht_ um statische Seiten) hunderttausende Male zu beanspruchen und den Server mit derart vielen Requests zu bombardieren.

                            Das ist mir klar, daher ist es, wie im Ausgangsposting zu sehen ist, auch nur zwischen 0:00 und 6:00 angedacht, um den regulären Archivbetrieb nicht zu stören.

                            Davon bitte ich Abstand zu nehmen. Auch gegen Mitternacht wird noch gesucht, und ganz nachts laufen dann regelmäßige Cron-Jobs zum Aufräumen. Suchmaschinenbots tun zwar im Prinzip dasselbe, aber vernünftige Bots saugen weder mehrere Seiten parallel, noch saugen sie kontinuierlich eine Seite nach der anderen. Wir hatten vor vielen Monaten das Problem, dass ein Professor einer deutschen Hochschule eine sehr frühe Beta seines Bots losgelassen hat - Resultat war eine sprichwörtliche DOS-Attacke auf den Server mit vielen Gigabytes sinnlosem Traffic. Die zugreifende IP mußten wir damals sperren, um den Server zu schützen.

                            Die Lage wird sich absehbar wirklich und definitiv entspannen. Christian Kruse hat während der Vereinsgründung verlautbaren lassen, dass in zwei bis vier Wochen die neuen Server online gehen können.

                            Auch wenn dann zunächst nur die alte Suche online geht, so sind die Suchzeiten doch ganz erheblich geringer - es steht einer der drei neuen Server exklusiv für diese Aufgabe zur Verfügung.

                            Daniela dagegen arbeitete im vergangenen Jahr (oder war es noch länger?) intensiv an der neuen Version der Suche, welche sie ebenfalls in Dortmund demonstrierte. Die ist im Vergleich zur alten Suche wirklich extrem schnell (ich habe die Zeiten nicht mehr im Kopf, aber Faktor 10 bis 100 war es wohl). Sobald Daniela eine erste Beta-Version freigibt, steht diese auf den neuen Maschinen ebenfalls zur Verfügung - zunächst noch parallel, da das Suchen aktuell noch nicht alle geplanten Features beherrscht. Außerdem müssen natürlich Bugs gefunden werden. Das wird in einem zunächst nicht-öffentlichen, später dann öffentlichen Betatest geschehen.

                            Insofern sehe ich eigentlich keinen Grund, jetzt noch private Ressourcen für irgendeine Verbesserung aufzuwenden. Sowas kann gar nicht so einfach so gut werden, wie das, was in zwei bis vier Wochen zur Verfügung steht. Konkret dazu zwei Bezüge:
                            1. CK hat mit der alten Suche, dem Suchwort "HTML", unbegrenzten Suchtreffern, ausführlicher Trefferanzeige und Suche über alles, was anklickbar ist, in vier Sekunden ein Ergebnis gehabt.
                            2. Andreas Korthaus hatte das, was euch jetzt offenbar wieder vorschwebt, ja auch schon mal versucht, ist aber auch von der notwendigen Performance überrascht worden (siehe z.B. http://forum.de.selfhtml.org/archiv/2002/10/27766/#m151005, Suchworte fürs Finden im Archiv z.B. "andreas korthaus fulltext mysql").

                            Ich denke, spätestens sobald die neue Suche die vier Sekunden, gemessen von Christian, transformiert in 0,1 Sekunden und darunter, "powered by Daniela", wird sich niemand mehr die Mühe machen, das _gesamte_ Archiv herunterzuladen, um es zuerst in einer _tagelangen_ Aktion zu indizieren, um es dann mit einer irgendwie gearteten Suchfunktion zu durchsuchen. Außerdem müßte man sich dann ja ständig die Mühe machen, neue Threads regelmäßig nachzupflegen.

                            Die neue Self-Suche hingegen kann direkt ans Forum andocken und erhält somit erstmalig die _Möglichkeit_ (wieweit Daniela das schon in Code umgesetzt hat, weiß ist aktuell leider nicht), auch die noch im beantwortbaren, nicht archivierten Teil des Forums existierenden Postings zu durchsuchen. Und man wird dann auch nicht mehr auf die nächtliche Indizierung archivierter Postings warten müssen, bevor man die findet, sondern das geschieht dann auch sehr zeitnah.

                            Noch schneller würde es wahrscheinlich nur mit Googles Suchmaschine gehen. Diese hat aber das Problem, dass es eine generische Suchmaschine ist, die auf die individuellen Eigenheiten des Self-Raumes nicht eingehen kann. Danielas Suche nutzt Indexer, welche individuell auf die einzelnen Bereiche (SELFHTML, Feature-Artikel, Tipps&Tricks, Forumsarchiv) angepaßt werden können.

                            PS: Sollte ich zu überschwänglich Danielas Suche loben, liegt das einfach daran, dass sie an der Suche schon so lange entwickelt, und man leider erst ganz am Schluß, wenn alles fertig ist, etwas davon sehen kann. Sie hat sich ihre Lorbeeren wirklich redlich verdient. Also habt bitte noch etwas Geduld, wir arbeiten _wirklich_ an dem Problem, und es wird _wirklich_ demnächst alles viel viel besser, schöner und schneller werden.

                            - Sven Rautenberg

                            1. Moin Moin!

                              derweil hatte mir Oraldo (Roland) eine Mail geschrieben und mir seinen Standpunkt darlegte. Aus meiner Antwort möchte ich punktuell zitieren:

                              ================================
                              [...]

                              Durch so einige Gegebenheiten habe ich auch mehr und mehr Schnittpunkte zu verschiedenen Programmiersprachen gehabt und bin selbst sehr interessiert an PHP. Daher bin ich bei verschiedenen kleinen Problemen auch gern im Archiv. Allerdings ist die Suche in Ihrer jetzigen Form doch mangelhaft und liefert zu einem gesuchten Begriff Treffer auch innerhalb eines Threads.
                              Ein etwaiger Suchbegriff "(PHP)" im Titel eines Dokuments bring also jedesmal n + t Sucherergebnisse und kommt nicht mal über das Jahr 2004 hinaus

                              (n sei dabei die Anzahl der Antworten eines Threads mit identischem Thema
                              t die Ausgangsbeiträge)

                              Aus diesem empfundenen Mangel heraus hatte ich schon ein paar mal Überlegungen angestellt dies zu umgehen, jedoch noch nie in die Tat umgesetzt. Für mich persönlich ist die Menge aller je gestellten Fragen zum Thema PHP lediglich rein informativer Natur, um mir eine breitestmögliche Basis auf diesem aber sicher später auch anderen Gebieten (Server steht dringend als Nächstes an) erarbeiten zu können.

                              Durch Toms Beitrag [1] habe ich einen simplen Argorithmus verfaßt, der eine Auswertung nach PHP alleine durchführt.

                              Dem fortführend sind zwei neu Gedanken aufgetaucht:

                              1. Der Steuerfluß ist derart simpel, daß gerade in Hinsicht auf das
                                  Erstellen von Profilen, die Struktur des Archivs einen gerade dazu
                                  einläd.

                              2. Die Arbeit, die für Tom angedacht ist, kann sich doch gleich rentieren
                                  indem sie jederman zugängig gemacht wird.

                              1.)

                              Das Archiv in seiner jetzigen From ist das präzise Abbild eines Datenfelds in Gestalt eines üblichen Dateisystems:

                              $archiv[jahr][monat][duchlaufende Nr] vgl. http://forum.de.selfhtml.org/archiv/2004/3/740390/

                              Es gibt augenscheinlich keine bessere Möglichkeit einem Spammer oder Profilersteller die Daten strukturiert zu übergeben.
                              Wie aber der Beitrag von Stefan [2] auch zeigen, gibt es auch ein Interesse nach Schutz vor solchen Machenschaften.

                              Doch was alles derzeit möglich ist, habe ich gestern Nacht erst mitbekommen, als ich die Archive 1998 und 1999 nach PHP durchlaufen habe. Und ich bitte dieses auch von mir unterstützte Interesse an Sicherheit nachhaltig und abgetrennt von meinem Wunsch intensiv zu diskutieren, um Mißbrauch, der auf Datenerfassung abgestellt ist, zukünfig zu zu erschweren.

                              Nach einem kurzen überfliegen von Svens [3] Antwort besteht der hinreichende Verdacht, das sich die öftere Überlasung alsbald durch die neuen Server erübrigt hat. Daher erlaube ich mir anzumerken, daß in diesem Zuge auch über eine Umstrukturierung des Archivs nachgedacht werden möge, die den Mißbrach von angegebenen E-Mails für Spam oder aber auch das detailierten ablegen von Zeitangaben verhindert.

                              2.)

                              Durch das Posting von Tom [1] bin ich dazu gekommen das Archiv durch Requests nach PHP aufzuschließen. Wie oben bereits angedeutet besteht ansich ehrlich Dargelegt kein weiterführendes Interesse, als die Mängel des Suchskripts zu beheben.

                              Mit Tom habe ich mich kurz in Verbindung gesetzt. Er gab mir Einsicht in sein Projekt und was er zu realisieren sucht, ist ein Tutorial von den Anfängen bis hin zu PHP 5. Das Forumsarchiv ist gerade für diese Belange eine unschätzbare Quelle.

                              Ich selbst habe daher aus freien Stücken entschlossen für mich und ungefragt für Tom das Arichv zu druchlaufen, um alle PHP-relevaten Dokumente zu speichern.

                              Um das Vergeben von Nutzungsmöglichkeiten dieser doch recht simplen Arbeit auszuschließen, habe ich mich an das Forum gewandt [3] um dies überhaupt dann per Mail an Stefan Münz anzutragen.

                              (Vor zwei Jahren war ich der Meinung eine detailierte Auflistung der Verantwortlichen gefunden zu haben, kann sie jedoch nicht mehr aus dem Gedächtnis reproduzieren und bitte Dich kurz um Weiterleitung bzw. mir mit einem Link weiterzuhelfen, wen ich korekter Weise zu kontaktieren habe)

                              Zu Deiner Frage nach dem Script:

                              [...]

                              Abschließendes:

                              Wie bereits geäußtert [4] werde ich über keinen Kopf hinweggehen und sehe die Bedenken einer Person (mit) gegenüber, die sich noch nicht alszulange lediglich gelegentlich im Forum beteilig, als berechtigt an.

                              Ich werde die Ablage des Archiv nicht weiter verfolgen. Daher bitte ich um Prüfung, ob zumindes Thomas (Tom) das Archiv für sein Projekt zur Verfügung gestellt werden kann.

                              Die Argumentation der bestenfalls als sehr kritischen zu bezeichnenden Rechtsfragen, die ich in meinen Vorüberlegung völlig außer acht gelassen habe, trage ich selbst mit. Daher kann ich aus eigener Überzeugung auch nicht anders, als davon abzulassen und gebe gleichfalls nachdrücklich zu bedenken, daß mein Beispiel, gezeigt hat, wie einfach die Daten zu erschließen / auszuwerten sind!

                              Weiterhin möchte ich anregen die Struktur des Archivs auch nach den einzelnen Themen zu überarbeiten und nicht nur nach Jahrgängen.

                              Ich wollte nur behilflich sein.

                              [Grußformel]

                              -----------------------
                              [...]

                              1 [pref:t=82117&m=478018]
                              2 [pref:t=82123&m=478157] ff.
                              3 [pref:t=82123&m=478080]
                              4 [pref:t=82123&m=478279]

                              ================================

                              Zudem noch anmerkend würde eine in die einzelnen Themen strukturierte, also indizierte, Suche den Bedarf nach einem Download erübrigen.

                              [ganzgorßeläuchtendekinderaugenkriegend] Bitte, bitte, bitte Daniela :)))

                              Gruß aus Berlin!
                              eddi

                              1. Hallo XaraX,

                                Durch so einige Gegebenheiten habe ich auch mehr und mehr Schnittpunkte zu verschiedenen
                                Programmiersprachen gehabt und bin selbst sehr interessiert an PHP. Daher bin ich bei
                                verschiedenen kleinen Problemen auch gern im Archiv. Allerdings ist die Suche in Ihrer
                                jetzigen Form doch mangelhaft und liefert zu einem gesuchten Begriff Treffer auch
                                innerhalb eines Threads.

                                In der Tat. Und das ist auch Absicht und gut so.

                                [... Angst vor Spammern ...]

                                Wenn du Angst vor Spammern hast, gib deine E-Mail-Adresse nicht an. Hier wird niemand
                                dazu gezwungen. Ein Interesse unsererseits die E-Mail-Adresse in irgendeiner Weise zu
                                verschleiern oder zu verdecken besteht nicht.

                                Grüße,
                                 CK

                                --
                                Sobald dir ein Gedanke kommt, lache über ihn.
                                http://wwwtech.de/
                                1. Moin CK,

                                  Allerdings ist die Suche in Ihrer
                                  jetzigen Form doch mangelhaft und liefert zu einem gesuchten Begriff Treffer auch
                                  innerhalb eines Threads.

                                  In der Tat. Und das ist auch Absicht und gut so.

                                  das muss sogar so sein...

                                  Wie sollte eine Suchfunktion Antworten liefern, wenn immer nur die Fragen durchsucht würden...?

                                  Diese (die Fragen) sind (leider) oft so unpräzise, dass das eigentliche Problem garnicht herauszulesen ist; das taucht dann erst in den Antworten auf.

                                  Glück auf
                                  Dirk

                  2. Hallo,

                    einiges hatte ich in betracht gezogen; Diskusionen über

                    • den Bedarf oder Nichtbedarf

                    Bedarf gibt es wohl, aber was denkst du warum wir  schon vor einer ganzen Weile die "Auslese" aufgegeben haben? Die dazu erforderliche redaktionelle Arbeit ist mengenmäßig einfach nicht zu bewältigen.

                    Deshalb sagen wir auch immer: wenn jemand sowas machen möchte, soll sich wirklich den aktuellen Thread (den er ja offenbar verfolgt) greifen und daraus einen Tip&Trick schreiben! Das wäre/ist nämlich die ideale Lösung.
                    Du kannst uns wirklich glauben, dass wir mit Auslese-Ideen und Versuchen schon Erfahrung haben und es zeigte sich bisher immer dasselbe: am Anfang große Begeiterung, dann zunehmende Desinteresse angesichts der zu bearbeitenden Menge an Text bis Aufgabe der Arbeit.

                    • die geringe Verfügbarkeit

                    Dazu wurde ja schon genügend gesagt.

                    • Offlinedurchsuchbarkeit

                    Mal so: google, kannst du auch nicht offline durchsuchen.

                    • Übertragungswege der Daten

                    ???

                    Aber daß sich eine Diskusion anbahnen würde, wie der Überschrift zu entnehmen ist über Datenschutz und m. E. darin eindeutig ist, hat mich völlig überrollt, da nicht erwartet.

                    Dennoch ist auch das ein zu beleuchtender Aspekt und ich stimme Swen absolut zu, daß hier ein Zustimmen durch Schweigen nicht gewollt sein kann.

                    In diesem Sinne könnte ein Entfernen aller E-Mail-Adressen und über die Angabe des Datums hinausgehenden Zeiten eine Lösung sein.

                    War auch schon alles da: es kam doch immer wieder vor das jemandem seine eigene "Meinung" später so peinlich war, dass er um die Löschung bat. Was natürlich bei einer Spiegelung um vieles vieles Problematischer wäre, als das jetzt schon ist (mit suchmaschinen-Caches etc. etc.) Aber diese Diskussion hatten wir ja auch schon :-(

                    Grüße
                    Thomas

        2. Hi Stefan,

          Mit der Archivierung der alten Postings habe ich kein Problem,
          ebenso mit dem redaktionellen Auswerten der Beiträge (wie die
          Forumsauslese früher).

          das sehe ich wie du. Mit dem Wissen, dass Beiträge archiviert werden erkläre ich mit dem Absenden eines Postings, dass ich damit einverstanden bin.

          Ehrlich gesagt finde ich es schade, dass die Diskussion jetzt auf
          einmal so in den rechtlichen Bereich geht. Ist der Wunsch, dass
          die archivierten Beiträge nur hier online verfügbar sein sollen,
          nicht ausreichend, muß sowas wirklich rechtlich geklärt werden?

          Mein Wunsch ist es, dass das Archiv im SELF-Raum abrufbar ist und sonst nirgends, da nur dies eine entsprechende Behandlung der Daten gewährleistet. Ich persönlich würde eine Spiegelung und/oder Aufbereitung auf einer externen Ressource ohne mein explizites Einverständnis nicht zulassen.

          Grüße,
           Roland

          1. Moin,

            Ich persönlich würde eine Spiegelung und/oder Aufbereitung auf einer externen Ressource ohne mein explizites Einverständnis nicht zulassen.

            Welche konkreten Befürchtungen führen dazu, dass Du das nicht zulasen möchtest?

            Liebe Grüße vom gepackten Koffer :-)

            Swen Wacker