Backup danych

Co to jest backup danych?

Backup  danych w środowisku IT to proces podczas, którego tworzone są kopie danych dzięki którym istnieje możliwość odtworzenia środowiska informatycznego po wystąpieniu zdarzenia częściowej lub całkowitej utraty danych. Odtworzyć można również dane, które zostały usunięte przez błąd aplikaci lub człowieka. Zaawansowane systemy centralnego backupu danych w zależności od nadanych polityk są w stanie przechowywać jedną lub więcej kopii danych z różnych okresów czasowych, stąd wraz z implementacją oprogramowania tej klasy niezbędne jest zapewnienie odpowiedniej przestrzeni dyskowej oraz taśmowej. Ponadto zgodnie z najlepszymi standardami warto tworzyć dodatkową kopię backupu umieszczoną poza obszarem ośrodka centralnego przetwarzania danych  na tzw. off-site ? w zależności od potrzeb może to być sejf, inny budynek lub wydzierżawiona część bankowego skarbca.

Rozważając opcję implementacji systemu backupu danych należy uwzględnić dwie kluczowe kwestie:

  • Okno backupowe ? jest to okres czasu w którym istnieje możliwość przeprowadzenia procedur związanych z tworzeniem kopii danych. Jest to czas w którym serwery nie są obciążone przez aplikacje oraz użytkowników a procedura backupu nie wpływa znacząco na dostępność serwerów.
  • Przepustowości infrastruktury sieciowej ? w przypadku rozproszonego środowiska ważnym aspektem jest przepustowość infrastruktury sieciowej organizacji. Backup powinien się odbywać w okresie jej najmniejszego obciążenia.

Modele przechowywania danych.

  • Backup przyrostowy (ang. Incremental backup) ? polega na utworzeniu za pierwszym razem pełnego backupu, na który składają się wszystkie wytypowane dane.  Przy kolejnych iteracjach tworzony jest backup przyrostowy, w skład którego wchodzą dane zmodyfikowane lub utworzone na nowo względem wcześniejszego przebiegu. Zmniejsza to łączną przestrzeń dyskową wymaganą do przetrzymywania kopii danych. Przy próbie odtworzenia danych konieczne jest posiadanie pierwszej pełnej kopii oraz ostatniej kopii przyrostowej wraz z kopiami poprzedzającymi.
  • Backup różnicowy (ang. Differential backup)? polega na utworzeniu za pierwszym razem pełnego backupu, na który składają się wszystkie wytypowane dane. Przy kolejnych iteracjach tworzony jest backup różnicowy, w skład którego wchodzą dane zmodyfikowane lub utworzone na nowo względem ostatniego pełnego backupu. Wykorzystanie przestrzeni dyskowej jest większe niż w przypadku backupu przyrostowego lecz do jego odtworzenia niezbędne jest posiadanie pierwszej pełnej kopii backupu oraz ostatniej kopii różnicowej.
  • Ciągła ochrona danych (ang. Continuous data protection) ? inaczej niż ma to w przypadku wcześniejszych metod, zmiany w systemie plików są monitorowane na bieżąco a kopie danych są tworzone na poziomie bloków a nie systemu plików.
  • Pełna kopia systemu ? ten rodzaj kopii danych tworzy kopię całej struktury dyskowej od partycji aż po system plików. Umożliwia odtworzenie systemu informatycznego na fizycznie innej maszynie wraz z systemem operacyjnym, zainstalowanymi aplikacjami oraz ustawionymi preferencjami.

Zaawansowane funkcjonalności.

Systemy centralnego backupu danych w głównej mierze ochraniają systemy operacyjne oraz aplikacje, które ze względu na swoje krytyczne znaczenie dla organizacji muszą być dostępne 24/7. Z tego względu producenci systemów zaimplementowali w swoich rozwiązaniach możliwość backupu on-line systemu plików oraz krytycznych aplikacji takich jak serwery pocztowe (MS Exchange, Lotus Domino), bazodanowe (DB2, Oracle, Informix, MS SQL), SAP oraz aplikacji (MS WebSphere).

Dodatkowo rozwiązania klasy enterprise są wyposażone w szereg mechanizmów, które przyspieszają proces tworzenia i odtworzenia kopii lub zapewniają większą ochronę przed nieautoryzowanym dostępem do nośników z kopiami danych:

  • Kompresja ? dzięki zastosowaniu wybranych algorytmów kompresji możliwe jest zmieszczenie miejsca zajmowanego przez dane.
  • Deduplikacja ? w przypadku tworzenia kopii danych wielu podobnych do siebie środowisk, mechanizm ten jest w stanie wyodrębnić dane, które są takie same dla wszystkich klientów. Takie dane trzymane są w jednej a nie wielu kopiach przez co zysk w oszczędności miejsca jest znaczący.
  • Duplikacja ? mechanizm ten zapewnia stworzenie duplikatu kopii na innym zbiorze nośników, przez co można skrócić czas tworzenia i odtworzenia kopii.
  • Szyfrowanie ? zapewnia dodatkową ochronę danych przed odczytem danych przez osoby nieautoryzowane.
  • Kolokacja ? rezerwuje zbiór nośników dla poszczególnych środowisk, przez co mogą one podlegać innym procedurom dla off-site oraz przyspieszają odtworzenie danych (wszystkie znajdują się w jednym miejscu).
  • Backup po SAN oraz NAS ? integracja oraz wykorzystanie protokołów sieciowych pozwala na tworzenie kopii bezpośrednio przez sieć SAN lub NAS odciążając serwer do którego należą dane.

 

Co to jest archiwizacja?

Celem archiwizacji jest tworzenie kopii danych, które muszą być przechowywane w niezmienionej postaci przez zadany okres czasu. Archiwizowanie danych jest stosowane w przypadku zobowiązania organizacji przez rozwiązania prawne do utrzymania niezmienionych danych w okresie np. 5 lat. Archiwizacja może być przeprowadzana również na danych, które mają być celem analizy lub audytu.