Sven Rautenberg: Wie kann google so schnell sein?

Beitrag lesen

Moin!

Stichwort: Grid Computing

Google ist hier unumstrittene, vielfach bewunderte Nr.1.

Kurz zusammengefaßt läuft es auf das hinaus: Indem man viele Computer nimmt, denen jeweils nur einen Teil der Suchdatenbank gibt, die Suchanfrage an alle Rechner parallel stellt und hinterher nur die eintreffenden Ergebnisse wieder zusammenpacken und in einer Webseite ausgeben muß (wobei ja standardmäßig erstmal nur zehn Suchergebnisse ausgeliefert werden - das ist auch noch ein Performancefaktor), kann man die Suchzeit auf einen Bruchteil einschmelzen.

Hat man tausend Computer, und hat jeder Computer nur ein tausendstel der Datenbank, ist eine Suche tausendmal so schnell. Wenn man dann noch Optimierungen am Speicher- und Suchverfahren vornimmt (Google verwendet keine herkömmliche Datenbank, die mit beliebigen Daten mehr oder weniger alles machen kann, sondern hat speziell auf das Problem angepaßte Software, welche ausschließlich dazu geeignet ist, Webseiten zu indizieren und schnell wiederzufinden), läßt sich alleine dadurch die Suchzeit sicherlich auch noch mal um den Faktor zehn bis tausend beschleunigen - insgesamt wird's also zehntausend bis eine Million mal schneller, als mit einer langweiligen MySQL-DB.

Wenn Google also 0,1 Sekunden braucht, würde MySQL (auf dem einen Rechner) im Verhältnis 1000 bis 100.000 Sekunden brauchen. Umgerechnet 16,6 Minuten bis 27,7 Stunden.

- Sven Rautenberg