Moin!
Ich persönlich würde von RAID 5 aber Abstand halten wollen. Es ist unperformant und fragiler - Eigenschaften, die durch den Vorteil bei der Festplatten-"Platzverschwendung" nicht aufgewogen werden nach meiner Bewertung.
RAID5 ist mit einem entsprechenden Controller keineswegs ein Problem - auch Softwareseitig flutscht das mit einer entsprechenden CPU.
Das Performanceproblem steckt weniger in der Berechnung der Redundanzdaten selbst - sondern vielmehr in den dafür notwendigen Operationen. Denn das sind I/O-Operationen mit den Festplatten, und somit immer langsam.
Wenn ich exakt einen Sektor schreiben will, dann muss ich alle beteiligten Sektoren der anderen Platten lesen und dann den neuen sowie den Redundanzsektor neu schreiben. Das Lesen von Platte nimmt mir der Cache nur im Ausnahmefall ab.
Abgesehen davon ist die Performance im Fehlerfall mit RAID 5 extrem mies. Unter dem Strich erhält man natürlich weiterhin seine Daten - aber jeder gelesene Sektor der fehlenden Platte muss durch Lesen aller beteiligten Sektoren aller anderen Platten wiederhergestellt werden.
Wenn ich nur Redundanz benötige: RAID 1 (mit zwei Platten). Wenn auch noch Performance gewünscht ist: RAID 1+0 (mit vier Platten).
Wenn du in kleinen Dimensionen denkst: möglicherweise ja - wenn du eine Serverfarm betreibst und eine gewisse Ausfallsicherheit gewährleisten willst, überlegst du dir 2x ob nur spiegelst oder doch lieber zu RAID5 greifst. Bei einigen 10.000 Platten die du da jährlich ersetzen _musst_ ist die rechnerische Nutzkapazität ein nicht zu verleugnendes Argument.
Bei Serverfarmen kommen weitaus mehr Faktoren in Betracht, als nur das reine Kosten-Nutzen-Verhältnis der erwünschten Ausfallsicherheit. Ab einer gewissen Anzahl an Platten muss man mit dem Plattenausfall leben, sich also Strategien überlegen, wie man um den Fail herumarbeiten kann, der garantiert auftritt.
RAID, egal welches Level, ist in dieser Situation vermutlich irrelevant. Aus Performancegründen dürften die Daten sowieso redundant auf mehr als einem Server lagern, jeder Server ist mutmaßlich mit Netzwerk-Boot und Auto-Install ausgerüstet und fährt nach dem Plattentausch automatisch wieder hoch und zieht sich dann seine Daten von den anderen Netzwerkknoten.
Das sind aber Bereiche, in denen ich derzeit noch keine tiefgehenden Erfahrungswerte gesammelt habe - außer durch das Studium diverser Papers und Videovorträge, die vor allem von Googles Rechenzentren existieren.
- Sven Rautenberg