Go to Top

Oswajamy przechowywanie danych: Czym jest RAID? [+wideo]

RAID

Autorem dzisiejszego posta oraz materiału wideo jest Mikey Anderson, nasz kolega z brytyjskiego biura Kroll Ontrack. Mikey wyjaśni, czym są macierze RAID i w jaki sposób pracują. Zapraszamy do lektury i obejrzenia filmu (w języku angielskim).

RAID – definicja

RAID to skrót od Redundant Array of Independent Disks, co po polsku oznacza nic innego jak nadmiarową macierz niezależnych dysków. To metoda przechowywania danych, która pozwala na rozmieszanie danych na wielu dyskach. Plusy? Możliwość uzyskania nadmiarowości danych, niezawodność, wydajność.

Nic zatem dziwnego, że wiele organizacji korzysta z konfiguracji RAID. To system stosowany od niemal 30 lat nie tylko przez przedsiębiorstwa, ale także przez użytkowników indywidualnych.

RAID sprzętowy vs. programowy

RAID system diagram

Istnieją dwa główne sposoby projektowania systemu RAID. Pierwszy z nich to rozwiązanie sprzętowe, które wymaga zastosowania dedykowanego kontrolera RAID, do którego podłączane są dyski. W tej konfiguracji kontroler RAID odpowiada za wszystko, co ma związek z macierzą – odczytywanie i zapis danych, a także miejsce ich przechowywania. System operacyjny hosta widzi dyski w macierzy RAID jako jedną jednostkę logiczną. To rozwiązanie cechuje się dużą wydajnością i niezawodnością. Wadą jest wysoka cena kontrolera.

W przypadku rozwiązania programowego nie stosuje się dodatkowego elementu w postaci kontrolera, wystarczą same dyski. Kontroler RAID jest zaimplementowany w samym systemie operacyjnym, co skutkuje niewielkim spadkiem wydajności, gdyż system „robi” wiele czynności naraz (odpowiedni moduł w systemie jest odpowiedzialny za zapis i odczyt danych w macierzy).

Część teorii już za nami! Jednak za nim przejdę do charakterystyki poszczególnych poziomów RAID, wyjaśnię kilka podstawowych terminów związanych z macierzami.

Podstawowe pojęcia

RAID key terms

Parity – parzystość

Parzystość oznacza sposób dystrybucji danych na wielu dyskach, co ułatwia rozkład obciążenia i ewentualne odzyskiwanie danych.

Redundancy – nadmiarowość

To pojęcie oznacza powielanie kluczowych elementów. Należy zaznaczyć, że nadmiarowość chroni przed awarią dysku, jednak nie przed uszkodzeniem danych – nie jest to kopia zapasowa! Stopień nadmiarowości zależy od zastosowanego poziomu RAID (o czym później).

Mirroring & striping

Pozostałe dwa kluczowe pojęcia, o których muszę wspomnieć, to mirroring i striping. Mirroring to tzw. RAID lustrzany – lustrzane odbicie danych na poziomie 1. Mówiąc prościej, mirroring oznacza lustrzane odbicie danych z jednego dysku na drugim.

Striping to fragmentacja danych na poziomie 0. Oznacza to, że dane są zapisywane sekwencyjnie na wielu dyskach (równomiernie zapisywane na każdym z dysków w macierzy).

OK, teraz mogę przejść do charakterystyki różnych poziomów macierzy RAID. Muszę jednak wspomnieć, że tych poziomów jest naprawdę wiele! Na potrzeby tego wpisu wybrałem cztery podstawowe.

RAID 0

RAID 0 system

W konfiguracji RAID 0 muszą występować co najmniej dwa dyski, na których dane zapisywane są równomiernie (striping). Dane zostają rozłożone na dwa nośniki, co jest doskonałym rozwiązaniem pod względem wydajności odczytu i zapisu na pojedynczym dysku. Nie jest to jednak już tak doskonałe rozwiązanie, kiedy weźmiemy pod uwagę nadmiarowość, gdyż dane nie są replikowane. Zatem wadą RAID 0 jest brak odporności na awarię dysków i co za tym idzie – brak bezpieczeństwa danych.

RAID 1

RAID 1 system

RAID 1 to tzw. poziom lustrzany. W tej konfiguracji także mamy do czynienia co najmniej z dwoma dyskami, na których dane zapisywane są w sposób – a jakże – lustrzany (dane są zapisywane równolegle na wszystkich dyskach w macierzy). Oznacza to, że w przypadku awarii jednego dysku, dane będą możliwe do przywrócenia bez większych problemów z drugiego. Takie rozwiązanie wyróżnia się zatem nadmiarowością i bezpieczeństwem danych – a jest to dopiero najniższa forma nadmiarowości dostępna w macierzach RAID.

RAID 5

RAID 5 system

Teraz przejdźmy na bardziej złożony poziom i przyjrzyjmy się konfiguracji RAID 5. W tym przypadku mowa jest już o parzystości (parity), czyli takiej dystrybucji danych, która w razie awarii jednego dysku umożliwia ich odzyskanie przy wykorzystaniu danych zapisanych na innych dyskach. Na rysunku widać, że mamy tutaj cztery dyski (RAID 5 wymaga co najmniej trzech dysków), a parzystość została zaznaczona na czerwono. Jeśli jeden dysk ulegnie awarii – na przykład czwarty – dane można będzie odbudować przy użyciu parzystości z innych dysków (parzystość w tej macierzy RAID 5 zajmuje całkowitą sumę jednego dysku, może zatem wytrzymać awarię jednego napędu).

Można pójść o krok dalej i skonfigurować piąty dysk jako tzw. hot spare, czyli mechanizm zabezpieczający, przejmujący rolę uszkodzonego urządzenia. Można powiedzieć, że jest to bezpieczny napęd, który znajduje się w systemie, ale nie uczestniczy w zapisywaniu danych. Kiedy jeden z dysków w macierzy ulegnie awarii – na przykład czwarty – hot spare (czyli napęd piąty) zajmie miejsce uszkodzonego dysku numer 4. Można usunąć uszkodzony dysk i zastąpić go nowym, który z kolei stanie się tym zabezpieczającym. To kolejny dobry sposób na uzyskanie nadmiarowości i zapobieganie utracie danych.

RAID 6

RAID 6 system

Dotarliśmy do konfiguracji RAID 6, w której mamy do czynienia z podwójną parzystością (dual parity). Na rysunku możesz zobaczyć macierz z pięcioma dyskami (RAID 6 potrzebuje minimum czterech dysków). Parzystość obejmuje wszystkie dyski, biorąc pod uwagę całkowitą ilość wolnego miejsca. Umożliwia to uniknięcie problemu z odzyskiwaniem danych w przypadku awarii nawet dwóch dysków! Takie rozwiązanie znacznie zwiększa poczucie niezawodności i bezpieczeństwa danych.

Muszę wspomnieć także o tym, że nadmiarowość i parzystość nie oznaczają kopii zapasowej! Pamiętaj, by pod żadnym pozorem nie rezygnować z wykonywania backupu, nawet gdy wykorzystujesz macierze RAID.

Zobacz także: Jak nie przejechać się na RAIDzie

Dobrnęliśmy do końca! Mam nadzieję, że w przystępny sposób wyjaśniłem Ci, czym tak właściwie jest RAID i jak funkcjonuje. Jeżeli chcesz dowiedzieć się czegoś na temat odzyskiwania danych z macierzy RAID, odwiedź naszą stronę internetową. A w razie utraty danych – skontaktuj się z nami!

Przechowujesz dane w macierzach RAID? Którego poziomu używasz i dlaczego? Podziel się z nami swoimi doświadczeniami związanymi z RAIDem w komentarzu!

, , , , , ,

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *