Go to Top

Jak nie przejechać się na RAIDzie

system RAID

RAID, czyli nadmiarowa macierz niezależnych dysków (Redundant Array of Independent Disks), zyskuje coraz większe uznanie. Nic dziwnego – koszty tego rozwiązania systematycznie się zmniejszają, a korzyści praktyczne płynące z tej technologii są ogromne. Macierz RAID jest zbudowana z niezależnych dysków twardych (obecnie także coraz częściej z dysków SSD), co umożliwia uzyskanie nadmiarowości danych (oznacza to, że część z nich może być duplikowana, dzięki czemu zmniejsza się ryzyko utraty). Do tej pory RAIDy najczęściej stosowane były w przedsiębiorstwach, gdzie doskonale sprawdzają się jako środowiska serwerowe i do magazynowania danych.

Coraz niższe ceny dysków sprawiają jednak, że konfigurowanie macierzy RAID staje się popularne także wśród użytkowników domowych, którym służą do przechowywania i udostępniania plików wideo, zdjęć i muzyki za pomocą domowej sieci, pomiędzy wieloma urządzeniami. Możliwości  są oczywiście znacznie większe, wspierają bowiem zarówno środowiska wirtualne (np. VMware, czy Microsoft Hyper-V), bazy danych (MS SQL i Oracle), platformy poczty elektronicznej, jak MS Exchange i właściwie wszystkie aplikacje, które możemy sobie wyobrazić  – na RAIDzie warto zainstalować zwłaszcza te, które wymagają płynności działania, stabilności i skalowalności.

Zarówno dla firmy jak i dla użytkownika domowego awaria systemu RAID jest bolesna. Jednak w przypadku firm, awaria architektury o krytycznym znaczeniu dla działalności, której konsekwencją jest utrata danych może być prawdziwą katastrofą.

Przezorny zawsze ubezpieczony – awarie RAIDa

System RAID jest zdecydowanie bardziej niezawodny niż pojedynczy dysk twardy albo dysk SSD. Wynika to z samej budowy tego rozwiązania – dzięki zastosowaniu wielu dysków, a także parzystej nadmiarowości, całość jest odporna w przypadku awarii jednego lub więcej dysków (w zależności od zastosowanej konfiguracji i ilości dysków w macierzy). W razie potrzeby rekonstrukcja informacji może zostać wykonana przy użyciu kopii, tworzonych podczas normalnych procesów zapisu.

Wiadomo jednak, że nie zostało jeszcze stworzone rozwiązanie, które zawsze i w każdej sytuacji jest niezawodne. Postanowiłem zapytać naszych ekspertów i stworzyć listę rad, dzięki którym nie przejedziesz się na RAIDzie. Zapraszam!

  1. Nie jest prawdą, że systemy RAID są odporne na utratę danych. Systemy te znacznie zmniejszają ryzyko utraty danych, ale nie rozwiązują tego problemu w stu procentach: nie ma systemów odpornych na utratę danych!
  2. Uważaj, RAID nie zawsze tworzy nadmiarową kopię informacji! Niektóre konfiguracje nie zapewniają odporności na awarię jednego z dysków, na przykład RAID 0 (striping) zwyczajnie rozdziela dane pomiędzy dyskami, bez wyliczania i tworzenia par na jednym z dysków. W takiej sytuacji awaria jednego z nich doprowadzi do utraty danych.
  3. RAID działa nawet jeśli jeden z dysków ulegnie awarii… (jest oczywiście “ale”, które znajdziesz w kolejnym punkcie) Generalnie to prawda, konfiguracje zapewniające nadmiarowość (czyli wszystkie poza RAID 0), są odporne na awarię jednego dysku, dzięki czemu cała macierz będzie nadal działać w takiej sytuacji. Jednak, kiedy tak się stanie nie zwlekaj, bo…
  4. RAID nie jest odporny na awarię dwóch (lub więcej) dysków. Większość najpopularniejszych konfiguracji, z RAID 5 włącznie, nie ochroni Cię przed utratą danych jeśli dwa dyski na raz ulegną awarii. Dopiero konfiguracja RAID 6, zapewniająca podwójną parzystość, jest odporna na taką sytuację – niestety taka nadmiarowość znacznie zmniejsza szybkość działania znacznej macierzy, dlatego wybór konfiguracji zawsze jest wyborem między szybkością a bezpieczeństwem.
  5. Wymiana zepsutego dysku. Bardzo często macierz RAID zbudowana jest z dysków tego samego producenta, tego samego typu, a nawet z tej samej serii produkcyjnej. Ułatwia to konfigurację (wszystkie mają takie same wymogi konfiguracyjne), jednak zwiększa prawdopodobieństwo, że jeśli jeden ulegnie awarii, niedługo tej samej awarii ulegną pozostałe. Wymień więc dysk jak najszybciej. Do wymiany używaj zawsze identycznego dysku (nie tylko pod względem pojemności, ale także szybkości), co pozostałe użyte w macierzy. Nigdy nie zastępuj zepsutego dysku dyskiem, który wcześniej był częścią innego systemu RAID!
  6. Odbudowa danych, czyli funkcja Rebuild. Po wymianie dysku należy zrekonstruować dane na całej macierzy, tak żeby nowy dysk mógł przejąć funkcje swojego poprzednika. Nawet jeśli Twój system RAID ma opcję “hot plug”, umożliwiającą wymianę dysku i odbudowę danych bez potrzeby wyłączania całego systemu (co zwłaszcza w przypadku serwerów jest bardzo pomocne), pamiętać trzeba, że operacja odbudowy, czyli po prostu konfiguracji nowego dysku obciążona jest szczególnym ryzykiem, nie powinna być więc nigdy przeprowadzana bez upewnienia się, że dysponujemy sprawnym i aktualnym backupem.
  7. Oznacz kolejność dysków. Każdy z dysków tworzących system RAID ma swoją specyficzną pozycję w macierzy, ponumerowanie dysków pozwoli ustalić ich fizyczną lokalizację w przypadku awarii i konieczności wysłania ich do laboratorium odzyskiwania danych. Wprawdzie obecnie dyski tworzące RAID przechowują w swojej pamięci informacje na temat ich lokalizacji w macierzy (dlatego też nie ma większego znaczenia jak podłączysz poszczególne dyski – system sam skonfiguruje je w odpowiedniej kolejności). Niestety może się zdarzyć, że dane te ulegną uszkodzeniu lub zostaną nadpisane, a wtedy Twój opis na dysku będzie miał kolosalne znaczenie.
  8. Nie korzystaj z funkcji naprawy w przypadku uszkodzenia danych. Przerwa w zasilaniu lub problemy systemowe mogą uszkodzić dane lub spowodować, że nie będzie do nich dostępu. Nie używaj w takim wypadku funkcji naprawy – tego typu funkcje przeprowadzają operacje zapisu, co może powodować dalsze uszkodzenia danych i utrudni proces odzyskiwania danych.
  9. Uważaj na “opcje domyślne”. Jeśli zmieniałeś domyślną konfigurację systemu (na przykład w celu zwiększenia szybkości lub bezpieczeństwa systemu), w przypadku błędów, nie przywracaj “opcji domyślnych” – spowoduje to zmianę konfiguracji, nadpisanie danych i w konsekwencji –  ich utratę.
  10. Jak najszybciej wyłącz system! W przypadku utraty danych w wyniku przypadkowego usunięcia, wciśnij jak najszybciej przycisk zasilania, żeby wyłączyć system. Systemowe wyłączenie może bowiem nadpisać dane akurat w miejscu, gdzie znajdowały się dane, które chcemy odzyskać. Podobnie postępuj w przypadku, jeśli któryś z dysków wydaje dziwne dźwięki – pomoże to zmniejszyć szkody w przypadku fizycznego uszkodzenia dysku (jeśli na przykład głowica magnetyczna rysuje powierzchnię talerza).
  11. Backup. Backup. Backup. Jeśli planujesz jakiekolwiek zmiany w konfiguracji RAID, upewnij się, że posiadasz sprawną i aktualną kopię zapasową. Zawsze!
  12. Jak przywracać backup. Nigdy nie przywracaj kopii zapasowej bezpośrednio na RAID, z którego straciłeś dane. Jeśli po takim zabiegu okaże się, że procedura nie zadziałała, albo kopia zapasowa była nieaktualna, dane, które przed operacją przywracania backupu można było odzyskać, będą nadpisane i niemożliwe do odzyskania.
  13. Pomoc techniczna producenta sprzętu. Pamiętaj, że pomoc producenta sprzętu w przypadku awarii, skoncentruje się na przywróceniu działania systemu, nie na odzyskaniu danych. Upewnij się, że działania, które są Ci rekomendowane, nie wpłyną na możliwość odzyskania danych, lub skonsultuj się ze specjalista odzyskiwania danych. W przeciwnym razie możesz mieć sprawny system, niestety bez możliwości odzyskania z niego danych.
  14. Straciłem dane, co teraz? Odzyskiwanie danych z RAID komplikują trzy czynniki:
  • jest to system zbudowany z kilku dysków, na których dane są zapisane/zorganizowane w sposób zupełnie inny niż w przypadku pojedynczego dysku;
  • dane zapisane w ten sposób mają bardzo skomplikowaną strukturę logiczną;
  • systemy RAID używane do celów biznesowych używają skomplikowanej i zaawansowanej architektury i sprzętu, często także dedykowanych lub wręcz stworzonych przez firmę, która ich używa.

Odzyskanie danych z RAID jest możliwe, ale bardzo ważny jest wybór odpowiedniego specjalisty – w tym przypadku kluczowe jest doświadczenie oraz dysponowanie odpowiednimi narzędziami. Ważna jest także możliwość stworzenia nowych narzędzi, dedykowanych do konkretnego przypadku, które będą w stanie rozwiązać niekonwencjonalne problemy związane z określoną konfiguracją czy rozwiązaniami sprzętowymi zastosowanymi przez klienta.

, , ,

3 Responses to "Jak nie przejechać się na RAIDzie"

  • Kaleron
    14 maja 2015 - 12:10 Reply

    Właśnie wczoraj dostałem macierz RAID1. Jeden dysk ma uszkodzone sektory, a na drugim zdążyła się rozlecieć struktura logiczna (lustro odbiło błędy odczytu z uszkodzonych sektorów) i zamiast partycji XFS zrobił się śmietnik. Oczywiście kopii bezpieczeństwa nie ma, bo sprzedawca powiedział, że zastosowane rozwiązanie jest w 100 % niezawodne i odporne na jakiekolwiek awarie.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *