Zavřít
Vstoupit Následujte nás

3S.cz

Odborná sekce

Archivace - jak a čím?

01.03.2012, 12:34

Pro soukromý i státní sektor bude vstup do nového desetiletí výzvou. Je už celkem obvyklé, že společnosti mají poměrně dobře vyřešena primární úložiště (disková pole) a mají zvládnuté zálohování. Vzniká však zcela nová potřeba – a to archivace. O tom, že archivace není zálohování a jak a čím se vlastně dnes archivuje a jaké jsou trendy v následujícím textu.

Archivace dat je v dnešní době velmi aktuální téma. Není tomu tak dávno, co mezi zálohováním a archivací bylo pokládáno jakési rovnítko a zálohovací SW se “ohýbaly” tak, aby se s nimi jakýmsi způsobem mohla provést archivace – či spíše dlouhodobá záloha.

Realita je taková, že zálohování a archivace jsou zcela odlišné činnosti řešící zcela rozdílné úlohy.

Co je to tedy zálohování?

Zálohování je pravidelné a bezpečné ukládání takových informací, které v případě potřeby umožní obnovit všechny potřebné systémy.

Primárním úkolem zálohování je tedy obnova systémů a to nejlépe ve stavu co nejaktuálněji odpovídajícímu požadovanému stavu (např. před havárií). Úkolem zálohování tedy není pohled do historie – samozřejmě krom minulosti bezprostředně související s produkčním prostředím firmy.

Co je to tedy Archivace?

Smyslem archivace je uchování a zajištění dlouhodobé dostupnosti digitálních dat.

To znamená, že digitální archiv musí řešit zcela jiné výzvy:

  • je třeba zajistit kontinuitu archivu nikoliv pouze na jednotky let a desetiletí
  • musí řešit neměnnost dokumentů( kontrolní mechanismy)
  • musí řešit jejich nemodifikovatelnost
  • a aby data nebyla pouze digitálním chaosem, musí umět pracovat s metadaty.

Požadavků na archiv je podstatně více a musí být v souladu jak s mezinárodními normami, tak českým právním prostředím. V následujícím se se věnuji technické stránce problému.

V minulosti existovala řada pokusů vyrobit technologii garantující uložení a životnost dat v horizontu stovky let. Jedním z příkladů byla magnetooptická média. A samozřejmě se nabízí otázka ”jak to bylo ověřeno?”, případně “bude za sto let existovat mechanika čtoucí taková média?” Obecně řečeno takováto snaha vedla k extrémně drahým řešením s velmi limitovanými kapacitami.

Proto bylo třeba hledat jinou koncepci. A tato koncepce říká – nehledejme hardware zajišťující životnost dat stovky let, ale hledejme standardy a jednoduché migrační mechanismy, které umožní zajistit život a kontinuitu dat, přestože se samotný hardware archivu se bude měnit, vyvíjet, přijdou nové technologie ukládání dat atd.

Tuto koncepci digitálního archivu má zvládnutou jen velmi málo výrobců na světě a ještě u menšího množství lze bez kompromisů tvrdit, že je to technologie fungující!

Hitachi Content Archive Platform

Produkty společnosti HITACHI patří ke špičce v oblasti STORAGE řešení. Pro účely archivace dat HITACHI disponuje řešením HCAP (Hitachi Content Archive Platform).

HCAP je digitální archiv schopný archivovat data po velmi dlouhou dobu (50, 100 let). Systém je založen na skupině společně fungujících nodů s jasně definovanými a neměnným rozhraním jak pro vnitřní komunikaci, tak pro externí komunikaci (přes kterou je možné definovat metadata k uloženým digitálním archiváliím).

Systém je tak připravený na to, aby v průběhu svého života bez složitých datových migrací byl schopen “vstřebávat” nové technoloogie (nové servery, nová disková pole) a byla tak zajištěna průběžná kontinuita dat.

Jedná se o robustní archivní řešení, které umožňuje uložení a autentifikaci neměnných dat pomocí digitálního podpisu i možnost ověření, že data jsou od doby uložení beze změny, a to po celou dobu uložení (tzv. retenční doba). Po uplynutí této retenční doby je možné data průkazně skartovat tak, jak je definováno pravidly organizace.

Systém HCAP je určen pro správu stále rostoucího objemu dat a může být velmi efektivně škálován. Jedná se o centralizovaný on-line digitální archiv, který umožňuje indexaci, archivaci i prohledávání objektů s neměnným obsahem (datových souborů a k nim přiřazeným metadatům) při použití retenčních a dalších pravidel pro ochranu dat. Systém HCAP je ideálním cílovým úložištěm pro přesun starších statických (neměnných) dat z drahých primárních diskových úložišť, významně snižuje náklady na zálohování dat a dramaticky zlepšuje čas nutný na vyhledání informací z archivu. Podrobněji o funkcionalitách a metadatech zde.

Primárním požadavkem archivu je samozřejmě jeho bezpečnost. Za tímto účelem obsahuje další funkce a mechanismy ochraňující archivovaná data. Jednou z těchto funkci je funkce DPL (Data Protection Level). DPL určuje počet (1, 2, 3 a 4) interních bezpečnostních kopií archivovaných souborů. Jednotlivé DPL kopie jsou rozmístěny a udržovány na různém hardwaru tak, aby v případě výpadku jednoho hardwaru byla vždy dostupná jiná kopie. Počet funkčních DPL kopií je neustále monitorován. V případě, že je interních kopií nedostatek (vlivem poruchy), je automaticky vytvořena další interní kopie tak, aby počet odpovídal nastavení DPL. V opačném případě (odstranění poruchy), kdy je počet internách kopií větší než nastavení DPL, dojde k redukci na správný počet.

Základním požadavkem pro archiv je také zajištění neměnnosti dokumentu po určitou dobu – tzv. retenční perioda. Lze nastavit takzvanou absolutní retenci, tedy explicitní nastavení data a času, dokdy nebude možné archivovaná data měnit nebo smazat (například 6. 10. 2077). Nebo může být retence nastavena relativně, například 20 let, 5 dnů, 6 hodin a 23 minut od data archivace. Retenční periodu zkrátit nebo odstranit. Retenční periodu lze pouze prodloužit. HCAP také podporuje šifrování dat.

V tomto mechanismu je digitální archiv zcela jinou technologií, než řešení vytvářející archiv pomocí  aplikace na serveru s připojeným diskovým polem. Rozdíl je především v bezpečnosti a zaručení skutečné jedinečnosti uložených dat – jde o to, že objekty uložené v digitálním archivu HCAP jsou (díky mechanismům retence, Worm, digitálního podpisu) z vnější “nenabouratelné” ať již neúmysleně, nebo úmyslnou snahou zfalšovat uložené dokumenty.

HCAP – co to tedy je?

Hitachi Content Archive Platform (HCAP) je otevřené řešení umožňující konsolidaci dílčích archivů různých aplikací v jediném digitálním archivu. Příchozí data jsou v konceptu HCAP archivována v jejich originálním formátu. Během procesu archivace vzniká logický objekt, který se skládá ze tří částí. První částí jsou originální data. Druhou část představují tzv. metadata, které si HCAP automaticky vytváří tzv. screeningem příchozích dat. HCAP umí automaticky rozpoznat až 370 typů souborů. Dále je možno k archivovaným datům přikládat i tzv. Custom metadata ve specifikaci xml. Poslední částí jsou pravidla popisující jak se může s archivovanými daty zacházet, retenční perioda, atd.

Velká a ve svém oboru unikátní funkce platformy HCAP je možnost centrálního vyhledávání přes všechna archivovaná data různých aplikací. Přístup k archivu je dán otevřenými standardy rodiny TCPIP, jako jsou CIFS, NFS, WebDAV, HTTP, SMTP, SMB, ATR. Koncept HCAP je plně kompatibilní s evropským standardem pro tvorbu digitálních archivů MoReq (modelové požadavky na správu elektronických dokumentů).

HCAP – Otevřené rozhraní pro další SW aplikace

Podstatnou vlastností každého digitálního archivačního systému by mělo schopnost otevřeného řešení a aplikační podpory řady další SW produktů, které existují na trhu.

Interoperabilita verzus Symantec Enteprise Vault

Jedním z nepropracovanějších a velmi perspektivních spojení je kombinace technologií Symantec Enterprise Vault a technologie HITACHI HCAP.

Centralizovaný archivační systém Software Enterprise Vault™ je flexibilní archivační systém, který umožňuje automatickou migraci dat z produkčních systémů do archivních systémů. Disponuje navíc funkcemi pro dohledání obsahu nacházejícího se v e-mailech, systémech souborů a prostředích podpory spolupráce.

Enterprise Vault využívá velkého množství archivačních politik na jejímž základě jsou fyzická data automaticky migrována na jiné druhy storage zařízení. Dále pomocí specifické archivační politiky můžeme nastavit ILM (parametry životního cyklu) pro jednotlivé typy dokumentů.

Archivy zachovávají bezpečnostní politiku pro jednotlivé přístupy k těmto datům a zároveň splňují náročné podmínky požadované auditory. Jedná se například o dobu uchovávání souborů (dokumentů), rychlost jejich dostupnosti, audit přístupu k archivu atd. Velmi dobře propracovaná automatizace procesů snižuje časové nároky na administraci celého systému a zároveň nabízí i široké možnosti pro manuální nastavení jednotlivých parametrů.