RAID – Redundant Array of Independent Disks – IT-Berufe-Podcast #179

Dieser Beitrag ist Teil 7 von 7 in der Serie Teil 1 der gestreckten Abschlussprüfung.

Um das beliebte Prüfungsthema RAID geht es in der einhundertneunundsiebzigsten Episode des IT-Berufe-Podcasts.

Probeabo bei Audible (Affiliate)

Inhalt

  • RAID: Redundant Array of Independent Disks (bzw. früher „inexpensive“ statt „independent)
  • Idee: Mehrere Festplatten zu einem Verbund („array“) zusammenschließen
  • Ziel: Ausfallsicherheit und höhere Verfügbarkeit (durch Einführung von Redundanz)
  • Bei Ausfall einer Festplatte kann sie getauscht und das RAID-Array wiederhergestellt werden („Rebuild“), in dieser Phase ist das RAID durch die hohe Belastung aber anfälliger für einen weiteren Festplattenausfall.
  • RAID ersetzt nicht die Datensicherung.
  • Lösung: Hardware- oder Software-RAID
    • Hardware mit speziellen RAID-Controllern
    • Software meist schon ins Betriebssystem eingebaut (z.B. in Linux)
  • Alternative: JBOD (just a bunch of disks)
  • Es gibt verschiedene RAID-Level
    • Kriterien: Mindestanzahl Festplatten, Ausfallwahrscheinlichkeit, maximal verkraftbare ausgefallene Festplatten, Lese-/Schreibgeschwindigkeit, Nettokapazität

RAID 0: Striping

  • keine Redundanz, Merksatz: „0 Redundanz“, „0 Sicherheit“
  • mindestens 2 Festplatten nötig
  • teilt Festplatten in gleich große Blöcke auf und verteilt die Daten darauf (stripes)
  • Kapazität kann komplett genutzt werden
  • dadurch kann schneller gelesen werden, da von mehreren Festplatten parallel gelesen wird
  • auch das Schreiben geht schneller, da Daten parallel auf mehrere Festplatten geschrieben werden (aufgeteilt)
  • fällt eine Festplatte aus, ist der gesamte Verbund defekt
  • Ausfallwahrscheinlichkeit steigt, da Einzelwahrscheinlichkeiten multipliziert werden (z.B. bei 1% Ausfallwahrscheinlichkeit 2,97% gesamt)
  • Einsatz: Streaming (viel Lesen, wenig Schreiben, Datenverlust verkraftbar bzw. anderweitig abgesichert), mehrere kleine zu einem großen Datenträger zusammenbauen
  • Nachteil: hohe Ausfallwahrscheinlichkeit

RAID 1: Mirroring

  • komplette Redundanz, Merksatz: „1-zu-1-Kopie“
  • mindestens 2 Festplatten nötig
  • Daten werden auf allen Festplatten identisch abgelegt
  • Kapazität wird halbiert oder gedrittelt usw.
  • Lesegeschwindigkeit kann erhöht werden, indem Daten parallel von mehreren Festplatten gelesen werden
  • Schreiben dauert länger, weil Daten auf mehrere Platten geschrieben werden müssen (Redundanz)
  • Verbund fällt erst aus, wenn alle Festplatten ausfallen
  • Ausfallwahrscheinlichkeit sinkt deutlich, z.B. bei 1% je Platte auf 0,0001%
  • auch Mirroring ist keine Datensicherung, Viren werden sofort auf alle Platten geschrieben
  • Einsatz: Hochverfügbarkeitssysteme
  • Nachteil: geringe Nettokapazität

RAID 5: Paritäten

  • Teilredundanz durch Ablage von Paritätsinformationen
  • mindestens 3 Festplatten nötig
  • zusätzlich zu den auf mehrere Festplatten verteilten Daten werden auf allen Festplatten Paritätsinformationen (z.B. XOR) je Datenblock abgelegt
  • Kapazität wird reduziert (z.B. 2/3 bei drei Festplatten)
  • Lesegeschwindigkeit kann erhöht werden, indem Daten parallel von mehreren Festplatten gelesen werden
  • Schreiben dauert durch Berechnung der Parität länger
  • Verbund fällt erst aus, wenn zwei Festplatten defekt sind
  • Ausfallwahrscheinlichkeit sinkt, z.B. bei 1% je Platte auf 0,0298%
  • Nachteil: bei häufigen Schreibzugriffen durch Berechnung der Parität langsamer

Irrelevante RAID-Level

  • RAID 2: Striping mit Fehlerkorrektur, nur bei Großrechnern eingesetzt
  • RAID 3/4: wie RAID 5 nur mit dedizierter Paritätsfestplatte (die dadurch stark belastet und zum Flaschenhals wird), bei RAID 3 wird auf Byte-Ebene und bei RAID 4 auf Block-Ebene gestript
  • RAID 6: wie 5 nur mit doppelter Parität

Kombinationen von RAID-Levels

  • best of both worlds aus anderen RAID-Leveln
  • immer von links nach rechts lesen und im Diagramm von unten nach oben: 01 -> zuerst werden zwei RAID 0 erstellt und dann zu einem RAID 1 zusammengebaut
  • ein Leg ist das RAID-Array „unten“ im Bild, aus dem das übergeordnete zusammengesetzt wird
  • es werden mind. 4 Festplatten benötigt
  • Kapazität wird halbiert
  • Verbund verträgt zwei Festplattenausfälle, aber es ist wichtig, welche Platten ausfallen

RAID 01

  • zwei Festplatten im gleichen Leg dürfen ausfallen
  • es kann nicht erkannt werden, welche Festplatte im RAID 0 ausgefallen ist, da dann das gesamte Array defekt ist
  • bei Ausfall einer Festplatte muss das gesamte Stripeset des Legs neu aufgebaut werden

RAID 10

  • zwei Festplatten in unterschiedlichen Legs dürfen ausfallen
  • bei Ausfall weniger Aufwand für Rebuild, weil nur im Leg gemirrort werden muss
  • Achtung: auch der RAID-Controller kann ausfallen

Links

Navigation der Serie<< Datensicherung (Backup) – IT-Berufe-Podcast #178
Polyglot Clean Code Developer
About the Author
Ausbildungsleiter für Fachinformatiker Anwendungsentwicklung und Systemintegration, IHK-Prüfer und Hochschuldozent für Programmierung und Software-Engineering.

4 comments on “RAID – Redundant Array of Independent Disks – IT-Berufe-Podcast #179

  1. Mark sagt:

    Hallo Stefan! Ich habe eine Frage zur Ausfallwahrscheinlichkeit bei RAID 5. Im Podcast ungefähr 39:58 erklärst Du wie man Ausfallwahrscheinlichkeit bei RAID 5 errechnet, Zitat: „1% * 1% * 1% = 0,0298% Ausfallwahrscheinlichkeit“.
    Wie kommst Du auf diese Zahl? VG Mark

  2. Stefan Macke sagt:

    Moin Mark, du musst die Wahrscheinlichkeit „umgekehrt“ berechnen: Die Wahrscheinlichkeit, dass das System fehlerfrei läuft, ist 0,99 * 0,99 * 0,99 = 0,970299. Und 1 - 0,970299 sind dann 0,029701.

  3. Andres sagt:

    Ich bin erst seit heute drauf gestoßen auf die postcast und finde die echt mega gut grad paar wochen vor der Prüfung

  4. Stefan Macke sagt:

    Freut mich, wenn ich helfen kann! 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

To create code blocks or other preformatted text, indent by four spaces:

    This will be displayed in a monospaced font. The first four 
    spaces will be stripped off, but all other whitespace
    will be preserved.
    
    Markdown is turned off in code blocks:
     [This is not a link](http://example.com)

To create not a block, but an inline code span, use backticks:

Here is some inline `code`.

For more help see http://daringfireball.net/projects/markdown/syntax