molily: Googles HTML-Versionen von PDFs - gehören die Google oder mir?

Beitrag lesen

Suchmaschinen machen das Web dadurch, dass sie zunächst einmal rücksichtslos handeln und individuelle Rechte missachten, zu dem benutzbaren Medium, was es heute ist. Die Menschheit profitiert insgesamt davon,

durchaus.
aber was ist mit einem inhalt, den ich - aus welchen gründen auch immer - nicht im index der SuMas wiederfinden möchte (*)?
hier bin ich auf explizites opt-out angewiesen!

Ja. Ich habe ja auch gesagt, dass das Vorgehen an sich betrachtet gegenüber den Autoren rücksichtslos ist.

vielleicht möchte ich einige inhalte nur bestimmten leuten zeigen (z.b. in dem ich nur ihnen den URL nenne bzw. vielleicht auch irgendwo auf einer nur wenigen leuten bekannten page verlinke), und möchte nicht, dass über eine SuMa jeder x-beliebige die datei findet.

Das ist zunächst einmal legitim, was ich nicht anzweifeln wollte. Suchmaschinen setzen tatsächlich den stillen Konsens voraus, dass eine öffentlich zugängliche Information im Web auch für die Öffentlichkeit zumindest insofern bestimmt ist, dass sie gefunden werden kann, wenn mehr oder weniger gezielt gesucht wird. Dieser Konsens existiert natürlich nicht.

Andererseits beinhaltet dieses Konzept von Öffentlichkeit und Veröffentlichung auch das Konzept der Privatheit durch geschützte Bereiche. Beides ist prinzipiell nicht ohne einander denkbar, daher ist Basic Authentication und Co. im Prinzip ein selbstverständliches Mittel, wenn Anforderungen wie die geschilderte auftauchen. Der offenen Natur des Mediums folgend basieren diese Schutzmechanismen auf explizitem Ausschluss anstatt generellem Ausschluss per Default und anschließendem Einschließen.
Was ich nicht verstehen kann, ist der Ärger darüber, dass private Daten in Suchmaschinen auftauchen, wenn die Zusammenhänge bestens bekannt sind. Der Opt-Out etwa bei Google ist m.M.n. auch vorbildhaft, was nicht heißt, dass dies die strukturelle Schwäche entschärft.

klar kommt jetzt das argument, aber genau dafür ist das web gedacht, dass jeder jede informationen finden kann.

Ich würde sicherlich nicht die Forderung erheben, dass jede Information, die von einem WWW-Server abgerufen werden kann, auch in diesem Sinne öffentlich sein muss. Aber ich denke, dass die Methoden zur Markierung und Sicherung privater Daten hinreichend sind, sodass das gegenwärtige Konzept der WWW-Benutzung nicht vollkommen verworfen werden muss, und darauf liefe dein Vorschlag m.E. hinaus.
Anders herum definiert sich eine Information dadurch als Teil des Webs, dass sie erreichbar/zugänglich/auffindbar ist, insofern ist das Web dafür gedacht, ja.

na schön, dann ist aber auch email dafür gedacht, dass wirklich _jeder_ mit dir unkompliziert in verbindung treten kann, was nach dieser interpretation auch den viagra-spammer mit einschliesst.

Dieser Vergleich ist wieder abwegig, weil der informationssuchende und interessierte Besucher, dem die Seite in welcher Hinsicht auch immer helfen könnte, mit einem hinterhältigen Spamversender gleichgesetzt wird, der betrügen, ausnutzen und hintergehen will.

Opt-In-Suchmaschinen würden das Web, wie wir es heute kennen, unbrauchbar machen und letztlich entvölkern. Ich mag gar nicht daran denken, wie sehr dies den Kulturraum WWW ausradieren würde, weil abermilliarden Sites dem zugänglichen Weltwissen entzogen würden.

nein, opt-in würde dem netz keine ressourcen entziehen, wenn sich die webmaster darüber informieren würden, was sie zu tun haben, um ihre webseite von den SuMas indexieren zu lassen - z.b. über eine robots.txt, die explizit darum bittet.

Das mag als Ursache-Wirkungs-Zusammenhang stimmen, ist aber utopisch. Die Bedingung würde höchstwahrscheinlich nie zutreffen, da sich die wenigsten Autoren darüber Gedanken machen oder etwa schlichtweg keine Meinung haben. Und mangelndes Interesse bzw. Unkenntnis aller Vor- und Nachteile der Findbarkeit und der praktischen technischen Methoden würde dazu führen, dass von den Milliarden automatisch indizierten Seiten nur noch hunderttausende übrig blieben, das wären dann die, die etwa heute in Katalogen auftauchen, welche durch Eigenanmeldung entstanden.