molily: Google

Beitrag lesen

Hallo, Hans,

danke erst einmal für deinen aufschlussreichen und interessanten Beitrag.

Der Trick ist also: Nicht alle denkbaren, sondern nur alle wirklich gefundenen Begriffe stehen im "Index" und für diese Begriffe ist die Suche und Reihenfolge schon fertig, bevor überhaupt jemand fragt. Das sind zwar viele Daten, aber es läßt sich offenbar (noch?) beherrschen.

Genau diese Frage stelle ich mir auch beim Lesen deiner Gedanken, denn die Datenmenge der Indizes muss astronomisch hoch sein. Wenn man ein Suchwort erfindet, braucht die Suche genauso lange wie wenn man die Suchmaschine nach einem ihr geläufigen Wort befragt. Demnach muss - wie du sagst - für alle möglichen Begriffe ein Index existieren, und wenn nach ein Suchbegriff 0 Treffer erzielt, dann bedeutet das schlichtweg, dass kein Index vorhanden ist; der gesamte Datenbestand wird nicht erneut nach dem vorher unbekannten Begriff durchsucht.
Für jedes im Web vorkommendes Wort müsste es also einen Index geben - damit dürfte es wohl im schlimmsten Falle mehr Indizes als indizierte Webseiten geben. Wenn man bedenkt, dass die Sprachschätze aller im Web vertretenen Sprachen, alle Eigennamen, Wortneuschöpfungen und -kombinationen und wohl nahezu alle möglichen Kombinationen aus den bekannten Zeichensatzbuchstaben bis zu einer bestimmten Länge als Indizes vorhanden sein müssten... dann ist das nichts als unvorstellbar.

Ich glaube, überall rätselt man über Google und spinnt neue Theorien... Ich hoffe, dass sich "in den nächsten Jahrzehnten" :) ein dezentrales, offenes Meta-Netzwerk etablieren wird, sodass nicht eine Firma die Macht über Wert und Relevanz von Informationen des Webs hat. Google zensiert schon heute, und das "uns bekannte Web" existiert vielleicht seit 5-8 Jahren und wird sich in weiteren fünf Jahren noch einmal komplett erneuert haben, und die Dominanz einzelner Konzerne wird hoffentlich schwinden.

Mathias