|
|
Datensicherheit durch RAIDEinleitungSehr wichtige Daten sind auf Ihrer Festplatte, Datenrettung im Katastrophenfall kann vor hohem finanziellen Verlusten schützen. Eine Festplatten-Datenrettung (Festplatten-Wiederherstellung) ist bei Verwendung von RAID kein Problem. Eine Datenrettung für eine defekte Festplatte (Datenrettung nach Formatieren, Festplattencrash, Datenrettung ontrack) ist oft mühsam und birgt eine wirtschaftliche Bedrohung wegen längerer Stehzeiten. Noch bedrohlicher kann Datenverlust sein. Sind Daten erst einmal unwiederbringlich verschwunden, etwa durch Formatierung einer Hard Disk, hilft kein Easy Recovery. Daten sichern ist nun mal Gebot der Stunde. Konzepte sind gefragt, ein solches ist RAID. Es muß nicht gleich die Festplatte formatiert sein oder defekt sein, kaputte Sektoren (bad sectors) bewirken bereits Datenverlust, wenn auch in geringerem Ausmaß, da vielleicht nur eine Datei beschädigt ist. Die Zeiten für Datenrettung von Diskette sind angesichts heutiger Datenmengen und umfangreicher Software vorbei, CD Datenrettung mag eine Bedeutung in Kleinstbetrieben oder im privaten Umfeld haben (Datenrettung-Software oder besser noch Datenrettung-Freeware, Datenrettung Tools gratis also, Software zur Datenrettung auf CD oder DVD sind als Datenrettung-Tool-Download oder Datenrettung-Programm-Download oder besser noch Datenrettung-Freeware-Download zu Hauf im Internet oder auf Zeitschriften CDs zu finden; Software zur Datenrettung, Software Download eingeschlossen - kein Problem), aber professionelles Datenmanagement verlangt nach professionellen Lösungen. Das beduetet mehr als nur gelöschte Dateneien wiederherstellen oder nach einem Festplattencrash einfach eine neue Festplatte einbauen. Daß das Risiko von Datenverlust durch Anfertigen von Kopien verringert werden kann, ist nicht neu. Das wissen auch Hersteller von Servern (Computer, der ein Service zur Verfügung stellt - siehe auch Application Service Providing). In Zeiten, wo EDV-Daten ein Unternehmenskapital darstellen und deren Verlust sogar zum Ruin eines Unternehmens führen kann, kommt der sorgsamen Speicherung von Daten besondere Bedeutung zu. Das durch Computer bearbeitete Datenvolumen steigt stark an, mehr Schreib/Leseoperationen führen jedoch zu langsameren Antwortzeiten. Spieglein, Spieglein im PCDas einfachste Konzept redundanter (mehrfacher) Datenhaltung ist das sogenannte Disk-Mirroring, das Spiegeln von ganzen Platteninhalten. Fällt eine Platte aus, kann mit der anderen eine weitere Kopie erstellt werden und weitergearbeitet werden. Zu beachten ist, daß die beiden Platten physisch getrennt sein sollten, wenn geht sogar mit zwei Controllern angeschlossen sein sollten. Bei nur einem Controller besteht das Risiko eines Systemausfalls wenn der Controller defekt ist. Bei zwei Controllern ist ein zweiter Datenkanal auf jeden Fall verfügbar. Die redundante Datenhaltung wurde vor allem durch den Preisverfall der Plattenspeicher möglich. Der Datendurchsatz, die Transferrate, und damit die Zugriffsgeschwindigkeit wird erhöht, indem auf mehrere Platten gleichzeitig zugegriffen wird. Der Begriff RAID steht für Redundant Arrays of Inexpensive Disks, also mehrfach geführte (Speicher)Bereiche auf nicht teuren Platten. Eine andere Definition lautet: Redundant Arrays of Independent Disks, was bedeutet mehrfach geführte (Speicher)Bereiche auf von einander unabhängigen Platten. Bei RAID werden Daten mehrfach (redundant) abgespeichert und über Prüfbits oder -bytes ständig die Datenkonsistenz geprüft. Oft sind zusätzlich Prüfprogramme im Einsatz, welche ständig die Laufwerke auf Fehler prüfen. Im Jahre 1987 wurde dieser Begriff dem SLED (Single Large Expensive Disks) entgegengestellt, um den wirtschaftlichen Vorteil gegenüber Einzelplatten besonders zu betonen. Und da EDV kompliziert sein muß, wurden gleich 5 Typen oder Stufen der RAID-Technologie definiert. RAID-TypologieRAID 0 bedeutet einfach verteilte Datenspeicherung, jedoch ohne besondere Sicherheit. Hier kann ein großer Datendurchsatz (schnelle Zugriffszeit) erreicht werden. Das geht allerdings zu Lasten der Datensicherheit. RAID 1 bedeutet einfach Mirroring (auch shadowing), wo Daten zweifach abgespeichert werden. Der zur Verfügung gestellte Speicherplatz wird zwar halbiert, aber der Datendurchsatz bleibt dennoch akzeptabel. Bei RAID 2 findet wie bei RAID 0 eine verteilte Datenspeicherung auf Bit-Ebene statt, das bedeutet, daß acht Laufwerke jeweils ein Bit eines Bytes speichern. Ein neuntes Laufwerk enthält ein Checkbit. Aus beliebigen acht Laufwerken kann ein defektes (egal welches) Laufwerk rekonstruiert werden. Diese Methode eignet sich besonders bei großen Datenmengen und spielt in der Großrechnerwelt eine Rolle. RAID 3 ist RAID 2 ähnlich, nur werden die Daten nicht bitweise, sondern byteweise verteilt. Das neunte Laufwerk hat also ein Controllbyte. Nachteilig wirkt sich die Tatsache aus, daß bei jeder Schreiboperation auf das Controllbyte zugegriffen werden muß. Das drückt die Zugriffsgeschwindigkeit. Einen Schritt weiter geht RAID 4, wo nicht Checkbytes, sondern ganze Kontrollblöcke aus 500 oder mehr Bytes auf ein Kontrolllaufwerk geschrieben werden. Allerdings bedeutet, daß bei Änderung auch nur eines einzigen Bits ein ganzer Block von >500 Bytes (>4000 Bits) am Kontrolllaufwerk geschrieben werden muß - und das kann dauern... RAID 5 geht noch einen Schritt weiter: Die Kontrolldaten sind auf mehrere Laufwerke verteilt, wodurch auf alle Laufwerke gleichzeitig zugegriffen werden kann. Dies erhöht den Datendurchsatz und somit die Zugriffsgeschwindigkeit. Maximal ein AusfallDie RAID-Technik setzt voraus, daß im Fehlerfall maximal nur eine Platte ausfällt. Diese Annahme ist durchaus akzeptabel, die Wahrscheinlichkeit mehrerer Ausfälle gleichzeitig ist sehr gering. Wieder einmal gilt: Absolute Sicherheit gibt es nicht! Dabei ist egal, welche Platte defekt ist. Aus den funktionierenden Platten kann das fehlende Laufwerk und somit ein Datenbestand wiederhergestellt werden. Das Errechnen der Checkinformation und das Rekonstruieren geschieht übrigens mittels XOR-Verknüpfung (exklusives OR aus der Bool'schen Logik). Ein weiteres Merkmal ist die Parallelität mehrerer Plattenzugriffe, was - wie schon erwähnt - für die Zugriffszeit von besonderer Bedeutung ist. |