Záloha není archiv?

18. 5. 2018. (redaktor: František Doupal, zdroj: DCD Publishing a Fujitsu)
V oblasti zálohování dat odborná komunita již mnoho let obhajuje názor, že „záloha není archiv“. Nicméně poslední vývoj u dodavatelů zálohovacího hardwaru a softwaru ukazuje, že situace se díky neustálé integraci nových funkcí, jako jsou například deduplikace dat a řízení životního cyklu s ukládáním dat do paměti, pomalu mění.

Lze zálohování sloučit s archivací, nebo jsou požadavky na tyto funkce tak odlišné, že záloha v klasickém slova smyslu nikdy nebude schopna zachytit potřeby pro archivaci dat?

Mezi zálohováním dat a archivací dat existuje několik klíčových rozdílů. Za prvé, zálohování dat zpravidla kopíruje data do médií pro obnovu, které mají sekvenční přístup, zatímco archivace dat obvykle přesune data do média s nižší úrovní náhodného přístupu a současně zanechává odkaz. Mimo to u zálohování uchováváme více kopií chráněných dat, zatímco archivy si uchovávají jednu kopii, která je uložena buď pomocí deduplikace nebo technologie CAS (Content Addressable Storage). Dalším důležitým rozdílem je, že archivace dat poskytuje možnosti indexování a vyhledávání v souborech, zatímco zálohy dat nabízejí maximálně vyhledávání klíčových slov nad politikami. A zejména, zálohování dat je obecně určeno pro krátkodobé ukládání pro účely obnovy, na rozdíl od archivů dat, které jsou určeny pro dlouhodobé uchovávání zejména z legislativních důvodů.

Většina platforem pro archivaci dat podporuje deduplikaci, a to jak na úrovni bloků, tak na úrovni souborů, nebo umožňuje využívat CAS algoritmů. Až donedávna bylo jedinou možností jak dosáhnout těchto vlastností použít dedikovanou in-stream appliance pro deduplikaci dat a dedikovaná média pro uložení (např. Fujitsu ETERNUS CS). Nyní společnosti jako Commvault nebo Veritas  nabízejí softwarové produkty pro deduplikaci dat bez omezení možností výběru koncového úložného média. Tato vlastnost softwaru odstraňuje paradigma, že zálohování potřebuje dedikovanou storage, resp. dedikovaná úložná média.

Dalším pokrokem v oblasti zálohování je implementace řízení životního cyklu dat. Na rozdíl od jednoduché expirace dat záloh založené na kombinaci stáří dat a typu úložného média většina zálohovacích softwarů dnes umožňuje přístupy založené na požadované úrovni služeb (SLA) a také kombinaci požadavků na RTO a RPO. Základní koncept spočívá v tom, že kritické aplikace mají své zálohy uložené na disku (rychlý přístup) a méně kritické aplikace mají své údaje uložené na nějakém typu sekvenčního média, typicky pásce. Zálohovací software nyní umožňuje migraci mezi vrstvami na základě stáří dat a potřeby přístupu k nim. Současně ovšem celý obraz zálohy migruje nebo vyprší během životního cyklu, takže granularita není srovnatelná s archivy (které spravují životní cykly na úrovni souborů).

Existuje několik zajímavých funkcí archivace dat, které se s největší pravděpodobností nikdy nebudou implementovat do prostředí pro zálohování dat jednoduše proto, že jejich účel je v rozporu se základním návrhem dobrého zálohovacího systému. Jednou z funkcí je schopnost vyhledávat a indexovat v souborech. Protože granularita záložních indexů se zastaví na úrovni souborů, systém zálohování nebude nikdy potřebovat indexovat na základě obsahu souboru.

Zatímco zálohování dat prošlo dlouhou cestou a přijalo několik klíčových rysů dobrého archivačního řešení, potřeby a požadavky stále nejsou stejné. Současně ale výrobci, jako například Commvault, vyvíjejí zálohovací a archivační funkce ruku v ruce, a umožňují pro využití obou řešení profitovat z jedné platformy s jedním management nástrojem.

Štítky: 

Podobné články

Jak COVID-19 (podle výrobců) ovlivnil ukládání a zálohování dat

7. 5. 2021. (redaktor: František Doupal, zdroj: DCD Publishing)
Jak se události z posledních měsíců promítly do přístupu k ukládání a zálohování dat jsme zjišťovali přímo u poskytovatelů souvisejícího hardwaru, softwaru a služeb. Některé z nastíněných trendů pravděpodobně vytuší každý, řada z nich vás však možná překvapí. Čtěte více

Trendy v tiskárnách a multifunkcích v polovině roku 2020

29. 9. 2020. (redaktor: František Doupal, zdroj: DCD Publishing)
Tiskárny a multifunkce jsou nedílnou součástí drtivé většiny firem, úřadů i domácností. Spolu se spotřebním materiálem jsou navíc také velmi důležitým prodejním artiklem. Jak se trh vyvíjí a jaké trendy můžeme v době, kterou stále výrazně ovlivňuje současná koronavirová situace, sledovat nebo již brzy očekávat? Čtěte více

Trendy v segmentu ukládání a zálohování dat – co nás čeká a nemine?

1. 7. 2020. (redaktor: František Doupal, zdroj: DCD Publishing)
Práce s daty je široká oblast rozprostírající se napříč různými segmenty produktů a služeb. V případě hardwaru se kromě NAS serverů a specializovaných úložišť stále setkáváme také s páskovými řešeními, ale jednoznačným trendem je růst důležitosti cloudu, softwaru a služeb… Čtěte více

Internet věcí v roce 2020: Jaký je a kam se bude ubírat

12. 5. 2020. (redaktor: František Doupal, zdroj: DCD Publishing)
IoT lze bez nadsázky označit za jednu z nejrychleji se rozšiřujících a rozvíjejících ICT technologií dneška. Celá oblast internetu věcí v sobě skrývá obrovský potenciál pro všechny zúčastněné, ať již hovoříme o výrobcích a dodavatelích, poskytovatelích služeb, partnerech či implementátorech nebo koncových zákaznících. Na současnost a budoucnost IoT jsme se ptali odborníků z různých oborů české IT scény. Čtěte více