Christian Kruse: Hitzeprobleme bei odin.selfhtml.org

Beitrag lesen

Ursachen des Serverausfalls gefunden, Problem gelöst

Wie es aussieht, ist das Problem erkannt worden: es scheint so zu sein, dass die Umgebungs-Temperatur im Rack zu hoch war. Die Sun Fire V20z hat ein eingebautes Sensoren-Set, unter anderem für die Umgebungs-Temperatur. Dieses Sensoren-Set wird überwacht von einem Service-Prozessor, einem embedded PowerPC. Übersteigt die Temperatur einen kritischen Grenzwert, schaltet sich der Rechner sang- und klanglos ab.

Mysteriös bei der Sache ist nur, dass vili.selfhtml.org, der physikalisch über Odin montiert wurde, sich nicht abgeschaltet hat. Die gemessene Umgebungs-Temperatur war dort 42°C. Auch unsere Ansprechpartnerin bei Sun konnte sich dieses Rätsel bisher nicht erklären.

Unser Provider hat jedoch freundlicherweise sehr schnell reagiert und eine provisorische Lösung des Hitze-Problems geschaffen: Es wurden weitere Decken- und Bodenplatten entfernt, außerdem wurden einige Löcher in die Rückwand des Racks gebohrt, so dass mehr heisse Luft direkt hinausgepustet werden kann. Dadurch fiel die Umgebungs-Temperatur auf etwa 35°C. Im Laufe der nächsten Woche soll die Rückwand vollständig durch eine gelochte Rückwand ersetzt werden, so dass die Temperatur weiter sinkt.

Derartige Fehler passieren leider immer wieder: Racks sind relativ eng gebaut, es ist nicht viel überflüssiger Platz da. Dadurch kann sich die Frischluft, die durch den Boden hineingepustet wird (man erinnere sich: warme Luft steigt nach oben), sehr leicht in den unteren Regionen des Racks verwirbeln. Die Folge ist ein Hitzestau in den oberen Regionen. Neuere Racks werden deshalb anders gebaut, geräumiger und mit Luft-Kanälen nach oben, so dass eine gleichmäßige Belüftung stattfinden kann.