Robert G.: RAID mit Windows 7 umsetzen

Hallo,

hab ein paar Fragen zu "RAID". Ist so wie ich das verstanden habe ein Verfahren zur redundanten Speicherung von Daten. Geht beispielsweise eine Festplatte kaputt, so kann diese im laufenden Betrieb ausgetauscht werden. Am geläufigsten sind wohl die RAID-Level 0,1 und 5. Außerdem habe ich gelesen das man den Kram rein Softwaretechnisch aber auch mit Hilfe zusätzlicher Hardware umsetzen kann.

Ich nutze Windows 7 und würde aus reinem Interesse mal gerne so ein RAID System in der Praxis umsetzen. Will mir keine zusätzliche Hardware kaufen, demnach kommt für mich nur die reine Softwarelösung in Frage. Festplatten sind genug vorhanden.

Wie leg ich denn jetzt los? Gibt es da irgendeine Anleitung für Windows 7? Hab diesbezüglich überhaupt keine Ahnung.

Sollte ich RAID 0,1 oder 5 verwenden?

  1. Moin!

    hab ein paar Fragen zu "RAID". Ist so wie ich das verstanden habe ein Verfahren zur redundanten Speicherung von Daten. Geht beispielsweise eine Festplatte kaputt, so kann diese im laufenden Betrieb ausgetauscht werden. Am geläufigsten sind wohl die RAID-Level 0,1 und 5. Außerdem habe ich gelesen das man den Kram rein Softwaretechnisch aber auch mit Hilfe zusätzlicher Hardware umsetzen kann.

    Deine Aussagen sind für sich genommen alle irgendwie eher richtig, aber das Gesamtbild, was du von RAID hast, ist dann doch nicht ganz so korrekt.

    Redundante Speicherung trifft beispielsweise nur für RAID 1 und 5 zu. RAID 0 speichert nicht redundant, weshalb es vom Datenverlustrisiko sogar höher liegt, als bei einer Einzelfestplatte (den statistischen Beweis spare ich mir) - allerdings ist RAID 0 auch performanter als eine Einzelplatte, wenn man also die höhere Geschwindigkeit braucht, und die Daten auf einem anderen Weg sichert, kann man das machen.

    "Im laufenden Betrieb" ist auch nicht allgemeingültig. Um beim eingeschalteten Rechner die Platte austauschen zu können muß diese "hot-swappable" eingebaut sein, sprich: Der Platteneinschub muß den Austausch unterstützen, der RAID-Controller und/oder das Betriebssystem. Und trotzdem kommt man nicht umhin, bei so einem Vorgang immer noch manuell einzugreifen und die Wiederherstellung entsprechend zu starten bzw. zu überwachen.

    Ich nutze Windows 7 und würde aus reinem Interesse mal gerne so ein RAID System in der Praxis umsetzen. Will mir keine zusätzliche Hardware kaufen, demnach kommt für mich nur die reine Softwarelösung in Frage. Festplatten sind genug vorhanden.

    Wie leg ich denn jetzt los? Gibt es da irgendeine Anleitung für Windows 7? Hab diesbezüglich überhaupt keine Ahnung.

    Ein RAID ist extrem unspektakulär. Man sieht davon absolut nichts - mal mit Ausnahme der Tatsache, dass die installierte Festplattenkapazität sich nicht komplett zum Speichern nutzen lässt, man also kleinere Zahlen sieht.

    So ein Software-RAID wird auch nicht von allen Windows-Versionen unterstützt, sondern ist nur in den teureren Edel-Versionen enthalten. Was benutzt du?

    Sollte ich RAID 0,1 oder 5 verwenden?

    RAID 0 keinesfalls. Das liefert keinerlei Datenredundanz.

    RAID 5 im Prinzip auch nicht wirklich. Ist zwar, was den Verlust an Platz durch Redundanz angeht, verhältnismäßig freundlich zu dir, erfordert aber mindestens drei Platten bzw. Partitionen gleicher Größe in einem Verbund, deren Gesamtkapazität dann nur 2/3 der Gesamtgröße aller Platten beträgt. Aber diese Redundanz muss von der CPU berechnet werden, Schreibvorgänge erfordern deshalb meist auch Lesevorgänge - da würde ich grundsätzlich Abstand von nehmen.

    Bleibt also nur RAID 1. Das schreibt alle Daten identisch auf beide (oder für Ultrahochsicherheit auch mehr als zwei) Platten, ohne dass irgendeine CPU dabei viel rechnen muss. Vorteil: Du kannst jede einzelne dieser Platten problemlos als Einzelplatte ansprechen, weil das gesamte Dateisystem darauf auch ohne RAID funktioniert. Wenn also mal richtig was kaputt geht, hast du im Zweifel immer noch die schadlose Platte und könntest die in einem anderen Rechner verbauen und auslesen.

    Bedenke aber, dass so eine Aktion in der Regel bedeutet, dass alle betroffenen Partitionen gelöscht und neu befüllt werden müssen. Wenn du also "Laufwerk C" auf RAID umstellen willst, könnte es sein, dass du Windows neu installieren musst. Was Windows da genau an Optionen anbietet, kann ich dir allerdings nicht sagen - ich hab da nur mit Linux meine Erfahrungen.

    - Sven Rautenberg

    1. Hallo,

      erstmal vielen dank für die tolle Antwort.

      Ich nutze Windows 7.

      Des weiteren hab ich mich für RAID 1 entschieden. Hier habe ich bei einem Einsatz von zwei Festplatten eine redundante Speicherung.

      Ich wills einfach mal testen, weil mich das einfach interessiert.

      Kannst du mir sagen, ob Windows 7 hier etwas für die Einrichtung von RAID mit sich bringt, oder ob ich mir hier eine bestimmte Software herunterladen muss? Ein Tutorial wäre hier super, hab gesucht aber leider keines gefunden.

      1. Moin!

        erstmal vielen dank für die tolle Antwort.

        Ich nutze Windows 7.

        Klar, das weiß ich schon. Hast du in deinem ersten Posting geschrieben. Wichtig ist aber, WAS für eine Version davon: Starter, Home Premium, Professional oder Ultimate (gibts alles jeweils ohne oder mit "N").

        RAID 0 ist angeblich in allen Versionen möglich. RAID 1 nur ab Professional. RAID 5 geht gar nicht.

        Des weiteren hab ich mich für RAID 1 entschieden. Hier habe ich bei einem Einsatz von zwei Festplatten eine redundante Speicherung.

        Ich wills einfach mal testen, weil mich das einfach interessiert.

        "Testen" klingt irgendwie merkwürdig. Was willst du testen? Platte rausreißen, um einen Fail zu simulieren? Wiederherstellung hinterher? Sollte man natürlich alles mal geprobt haben - aber entweder will man RAID 1, dann richtet man sich das ein. Oder man will es nicht. Für "nur mal testen" ist das kein unerheblicher Aufwand.

        Kannst du mir sagen, ob Windows 7 hier etwas für die Einrichtung von RAID mit sich bringt, oder ob ich mir hier eine bestimmte Software herunterladen muss? Ein Tutorial wäre hier super, hab gesucht aber leider keines gefunden.

        Windows 7 hat, wenn die Version das unterstützt, im Datenträgermanager alles, was du brauchst - sagt "das Internet". Googlen hilft.

        - Sven Rautenberg

        1. RAID 0 ist angeblich in allen Versionen möglich. RAID 1 nur ab Professional. RAID 5 geht gar nicht.

          RAID 5 ist sogar unter Windows XP möglich ;)

          http://www.tomshardware.de/raid-5-freischaltung,testberichte-959-12.html

          1. Moin!

            RAID 0 ist angeblich in allen Versionen möglich. RAID 1 nur ab Professional. RAID 5 geht gar nicht.

            RAID 5 ist sogar unter Windows XP möglich ;)

            http://www.tomshardware.de/raid-5-freischaltung,testberichte-959-12.html

            Wir reden hier aber nicht von XP, sondern von Windows 7. Und ich kann auch nur zitieren, was sich mit Google finden lässt. Und das sagt: RAID 5 mit Windows 7 "iss nich".

            Ich persönlich würde von RAID 5 aber Abstand halten wollen. Es ist unperformant und fragiler - Eigenschaften, die durch den Vorteil bei der Festplatten-"Platzverschwendung" nicht aufgewogen werden nach meiner Bewertung.

            Wenn ich nur Redundanz benötige: RAID 1 (mit zwei Platten). Wenn auch noch Performance gewünscht ist: RAID 1+0 (mit vier Platten).

            - Sven Rautenberg

            1. Wir reden hier aber nicht von XP, sondern von Windows 7. Und ich kann auch nur zitieren, was sich mit Google finden lässt. Und das sagt: RAID 5 mit Windows 7 "iss nich".

              Somit als Wort der "Aufklärung": geht schon, is nur versteckt :)

              Ich persönlich würde von RAID 5 aber Abstand halten wollen. Es ist unperformant und fragiler - Eigenschaften, die durch den Vorteil bei der Festplatten-"Platzverschwendung" nicht aufgewogen werden nach meiner Bewertung.

              RAID5 ist mit einem entsprechenden Controller keineswegs ein Problem - auch Softwareseitig flutscht das mit einer entsprechenden CPU.

              Wenn ich nur Redundanz benötige: RAID 1 (mit zwei Platten). Wenn auch noch Performance gewünscht ist: RAID 1+0 (mit vier Platten).

              Wenn du in kleinen Dimensionen denkst: möglicherweise ja - wenn du eine Serverfarm betreibst und eine gewisse Ausfallsicherheit gewährleisten willst, überlegst du dir 2x ob nur spiegelst oder doch lieber zu RAID5 greifst. Bei einigen 10.000 Platten die du da jährlich ersetzen _musst_ ist die rechnerische Nutzkapazität ein nicht zu verleugnendes Argument.

              1. Moin!

                Ich persönlich würde von RAID 5 aber Abstand halten wollen. Es ist unperformant und fragiler - Eigenschaften, die durch den Vorteil bei der Festplatten-"Platzverschwendung" nicht aufgewogen werden nach meiner Bewertung.

                RAID5 ist mit einem entsprechenden Controller keineswegs ein Problem - auch Softwareseitig flutscht das mit einer entsprechenden CPU.

                Das Performanceproblem steckt weniger in der Berechnung der Redundanzdaten selbst - sondern vielmehr in den dafür notwendigen Operationen. Denn das sind I/O-Operationen mit den Festplatten, und somit immer langsam.

                Wenn ich exakt einen Sektor schreiben will, dann muss ich alle beteiligten Sektoren der anderen Platten lesen und dann den neuen sowie den Redundanzsektor neu schreiben. Das Lesen von Platte nimmt mir der Cache nur im Ausnahmefall ab.

                Abgesehen davon ist die Performance im Fehlerfall mit RAID 5 extrem mies. Unter dem Strich erhält man natürlich weiterhin seine Daten - aber jeder gelesene Sektor der fehlenden Platte muss durch Lesen aller beteiligten Sektoren aller anderen Platten wiederhergestellt werden.

                Wenn ich nur Redundanz benötige: RAID 1 (mit zwei Platten). Wenn auch noch Performance gewünscht ist: RAID 1+0 (mit vier Platten).

                Wenn du in kleinen Dimensionen denkst: möglicherweise ja - wenn du eine Serverfarm betreibst und eine gewisse Ausfallsicherheit gewährleisten willst, überlegst du dir 2x ob nur spiegelst oder doch lieber zu RAID5 greifst. Bei einigen 10.000 Platten die du da jährlich ersetzen _musst_ ist die rechnerische Nutzkapazität ein nicht zu verleugnendes Argument.

                Bei Serverfarmen kommen weitaus mehr Faktoren in Betracht, als nur das reine Kosten-Nutzen-Verhältnis der erwünschten Ausfallsicherheit. Ab einer gewissen Anzahl an Platten muss man mit dem Plattenausfall leben, sich also Strategien überlegen, wie man um den Fail herumarbeiten kann, der garantiert auftritt.

                RAID, egal welches Level, ist in dieser Situation vermutlich irrelevant. Aus Performancegründen dürften die Daten sowieso redundant auf mehr als einem Server lagern, jeder Server ist mutmaßlich mit Netzwerk-Boot und Auto-Install ausgerüstet und fährt nach dem Plattentausch automatisch wieder hoch und zieht sich dann seine Daten von den anderen Netzwerkknoten.

                Das sind aber Bereiche, in denen ich derzeit noch keine tiefgehenden Erfahrungswerte gesammelt habe - außer durch das Studium diverser Papers und Videovorträge, die vor allem von Googles Rechenzentren existieren.

                - Sven Rautenberg

                1. Das Performanceproblem steckt weniger in der Berechnung der Redundanzdaten selbst - sondern vielmehr in den dafür notwendigen Operationen. Denn das sind I/O-Operationen mit den Festplatten, und somit immer langsam.

                  Wenn ich exakt einen Sektor schreiben will, dann muss ich alle beteiligten Sektoren der anderen Platten lesen und dann den neuen sowie den Redundanzsektor neu schreiben. Das Lesen von Platte nimmt mir der Cache nur im Ausnahmefall ab.

                  Das Problem hast du aber bei einem gespiegelten Array auch - zumidnest beim Schreiben. Beim lineraen Lesen ist das gespiegelte Array natürlich schneller (sofern der Controller nicht dämlich ist).

                  Abgesehen davon ist die Performance im Fehlerfall mit RAID 5 extrem mies. Unter dem Strich erhält man natürlich weiterhin seine Daten - aber jeder gelesene Sektor der fehlenden Platte muss durch Lesen aller beteiligten Sektoren aller anderen Platten wiederhergestellt werden.

                  Kommt darauf an, wie du den Fehlerfall definierst. Wenn eine Platte des Arrays ausfällt, gibt es zwar einen Performanceeinbruch, aber der ist relativ zum Fehlerfall bei einem RAID 1 wesentlich geringer. Beim Live-Rebuild hat RAID 5 ohnehin die Nase vorn, da kann man sich mit RAID 1 beerdigen.

                  Das sind aber Bereiche, in denen ich derzeit noch keine tiefgehenden Erfahrungswerte gesammelt habe - außer durch das Studium diverser Papers und Videovorträge, die vor allem von Googles Rechenzentren existieren.

                  Hier gehts mir genauso wie dir ;)

                  1. Moin!

                    Das Performanceproblem steckt weniger in der Berechnung der Redundanzdaten selbst - sondern vielmehr in den dafür notwendigen Operationen. Denn das sind I/O-Operationen mit den Festplatten, und somit immer langsam.

                    Wenn ich exakt einen Sektor schreiben will, dann muss ich alle beteiligten Sektoren der anderen Platten lesen und dann den neuen sowie den Redundanzsektor neu schreiben. Das Lesen von Platte nimmt mir der Cache nur im Ausnahmefall ab.

                    Das Problem hast du aber bei einem gespiegelten Array auch - zumidnest beim Schreiben. Beim lineraen Lesen ist das gespiegelte Array natürlich schneller (sofern der Controller nicht dämlich ist).

                    Nein, habe ich da nicht. Da schreibe ich einfach den Sektor - der wird dann an beide Laufwerke des RAID 1 geschickt. Leseoperationen sind gar nicht notwendig. Also pro Laufwerke genau eine Schreiboperation.

                    Bei RAID 5 muss ich mindestens den alten Sektor lesen, sowie auch den Redundanzsektor, dann aus der Redundanz den alten Sektor rausrechnen und den neuen hinzufügen, und am Ende beide Sektoren neu schreiben. Das beschäftigt zwei der beteiligten Platten mit einem Lese- und einem Schreibzugriff.

                    Abgesehen davon ist die Performance im Fehlerfall mit RAID 5 extrem mies. Unter dem Strich erhält man natürlich weiterhin seine Daten - aber jeder gelesene Sektor der fehlenden Platte muss durch Lesen aller beteiligten Sektoren aller anderen Platten wiederhergestellt werden.

                    Kommt darauf an, wie du den Fehlerfall definierst.

                    Man kann sich auch böse Fehlerszenarien ausdenken, bei denen eine Platte einfach nicht mehr die korrekten Daten liefert. Dank Redundanz müsste man das merken können, aber die wenigsten Controller achten darauf. Aber das auszudiskutieren würde deutlich zu weit führen. Nehmen wir einfach an, eine Platte ist komplett weg.

                    Wenn eine Platte des Arrays ausfällt, gibt es zwar einen Performanceeinbruch, aber der ist relativ zum Fehlerfall bei einem RAID 1 wesentlich geringer. Beim Live-Rebuild hat RAID 5 ohnehin die Nase vorn, da kann man sich mit RAID 1 beerdigen.

                    Mag sein, dass RAID 1 in der Fail-Performance bei RAID 5 unterlegen ist. RAID 5 ist aber klar einem RAID 1+0-Szenario unterlegen. Sagen zumindest meine Quellen - und die belegen das für mich nachvollziehbar.

                    Außerdem ist die Frage, welchen Vorteil RAID 5 gegenüber RAID 1+0 haben sollte. Die Performance ist es sicher nicht, bliebe nur die Kapazität. Allerdings: Ein RAID 5 aus drei Laufwerken mit Hot-Spare sind auch vier Platten mit der Kapazität von nur zweien.

                    Obendrein haben die Server mit 1HE oft nur Platz für zwei Festplatten, da würde RAID 5 also unmöglich sein. Storage-Systeme, die unabhängig von der Performance einfach möglichst ausfallsicher viel speichern sollen, sind dagegen mit RAID 5 und Hot-Spare oder gar RAID 6 gut bedient.

                    - Sven Rautenberg

                    1. Man kann sich auch böse Fehlerszenarien ausdenken, bei denen eine Platte einfach nicht mehr die korrekten Daten liefert. Dank Redundanz müsste man das merken können, aber die wenigsten Controller achten darauf. Aber das auszudiskutieren würde deutlich zu weit führen. Nehmen wir einfach an, eine Platte ist komplett weg.

                      Natürlich aber bei den "bösen Fehlerszenarien" wäre man bei RAID 1 ebenfalls aufgeschmissen - wenn eine der Platte fehlerhafte Daten liefert, muss von der zweiten Platte gelesen werden - und eben nicht mehr gleichzeitig von beiden.

                      Mag sein, dass RAID 1 in der Fail-Performance bei RAID 5 unterlegen ist. RAID 5 ist aber klar einem RAID 1+0-Szenario unterlegen. Sagen zumindest meine Quellen - und die belegen das für mich nachvollziehbar.

                      Außerdem ist die Frage, welchen Vorteil RAID 5 gegenüber RAID 1+0 haben sollte. Die Performance ist es sicher nicht, bliebe nur die Kapazität. Allerdings: Ein RAID 5 aus drei Laufwerken mit Hot-Spare sind auch vier Platten mit der Kapazität von nur zweien.

                      Ein RAID5 aus 3 Platten + 1 Hotspare ist aber deutlich weniger Wartungsaufwändig. Geht eine Platte kaputt, muss man nicht akut eingreifen und hat zumindest ein paar Stunden schonfrist.

                      Zudem ist ein vollständiger Ausfall des Arrays bei vier aktiven Platten wahrscheinlicher als einer bei nur drei Platten.

                      Darum ist RAID 5 ja auch ein Kompromiss aus Leistung und Nutzkapazität

                      Obendrein haben die Server mit 1HE oft nur Platz für zwei Festplatten, da würde RAID 5 also unmöglich sein.

                      In 1-HE-Geräten ist genug Platz für vier Festplatten - besonders dann, wenn es nur als Fileserver dient. z.B. ein Linksys NSS4000, das Ding ist halb leer - trotz vier Festplatten - da wäre noch genug platz für die restliche Hardware eines Webservers ;).

                      Storage-Systeme, die unabhängig von der Performance einfach möglichst ausfallsicher viel speichern sollen, sind dagegen mit RAID 5 und Hot-Spare oder gar RAID 6 gut bedient.

                      Das sowieso :)

    2. Redundante Speicherung trifft beispielsweise nur für RAID 1 und 5 zu. RAID 0 speichert nicht redundant, weshalb es vom Datenverlustrisiko sogar höher liegt, als bei einer Einzelfestplatte (den statistischen Beweis spare ich mir)

      Auch wenn du dir den statistischen Beweis sparst dennoch eine Anmerkung: die Wahrscheinlichkeit eines Datenverlusts ist bei einen RAID keineswegs von Bedeutung, da ein RAID egal in welcher Form niemals ein Backup ersetzt und auch nicht als Ersatz für ein solches gedacht ist.

      Wenn man einen Hardwaredefekt außer acht lässt, ist die Wahrscheinlichkeit mit einem RAID (egal welches Level) Daten zu verlieren, gleich groß wie bei einer Einzelplatte oder einem anderen RAID-System.

      Bei einem RAID geht es einzig und allein um Performance oder Redundanz - besonders zweiteres vor allem aus dem Grund um in einer Serverinfrastruktur die Ausfallzeiten so gering wie möglich zu halten.

      "Im laufenden Betrieb" ist auch nicht allgemeingültig. Um beim eingeschalteten Rechner die Platte austauschen zu können muß diese "hot-swappable" eingebaut sein, sprich: Der Platteneinschub muß den Austausch unterstützen, der RAID-Controller und/oder das Betriebssystem. Und trotzdem kommt man nicht umhin, bei so einem Vorgang immer noch manuell einzugreifen und die Wiederherstellung entsprechend zu starten bzw. zu überwachen.

      Nicht ganz - bei Hot-Spare-Systemen - wie sie bei gängigen RAID-5-Controllern Standard sind, ist nichtmal ein sofortiges eingreifen notwendig. Beispiel: 3 Platten liegen im Array, eine hängt abgeschaltet am Controller. Geht eine Platte kaputt oder hat seinen SMART-Schwellwert überschritten, wird automatisch der Rebuild-Prozess auf die Ersatzplatte gestartet und der Administrator informiert.

      Ein RAID ist extrem unspektakulär. Man sieht davon absolut nichts - mal mit Ausnahme der Tatsache, dass die installierte Festplattenkapazität sich nicht komplett zum Speichern nutzen lässt, man also kleinere Zahlen sieht.

      Unter Windows sieht man das sehrwohl in der Datenträgerverwaltung - dort wird das Array auch zusammengebaut.

      Auf ein softwareseitiges Windows-RAID-5 Windows zu installieren ist allerdings etwas tricky ;)

      So ein Software-RAID wird auch nicht von allen Windows-Versionen unterstützt, sondern ist nur in den teureren Edel-Versionen enthalten. Was benutzt du?

      Das ist so nicht ganz richtig - enthalten ist es auch in den "billigen" Versionen. Die Datenträger sind seit Vista identisch. Ansich wird nur durch die Lizenzform entschieden, was das Windows kann. Prinzipiel lassen sich die fehlenden Features auch nachträglich aktivieren - indem man z.B. seinen Key gegen einen höherwertigen Key ersetzt - andere Methoden lasse ich jetzt außen vor.

      RAID 5 im Prinzip auch nicht wirklich. Ist zwar, was den Verlust an Platz durch Redundanz angeht, verhältnismäßig freundlich zu dir, erfordert aber mindestens drei Platten bzw. Partitionen gleicher Größe in einem Verbund, deren Gesamtkapazität dann nur 2/3 der Gesamtgröße aller Platten beträgt.

      2/3 Stimmt für drei Platten, für 4 Platten aber nicht mehr - die Kapazität erreichnet sich nach  (n-1) x kleinste Kapazität.