Hlavní navigace

Zálohování a bezpečnost dat

1. 5. 1998

Sdílet

V tomto "dílu" trendů se podíváme na zálohování a bezpečnost dat. Pro tentokrát budeme ignorovat otázku bezpe



V tomto "dílu" trendů se podíváme na zálohování a bezpečnost dat.
Pro tentokrát budeme ignorovat otázku bezpečnosti informací
ohrožených lidským protivníkem a zaměříme se spíše na tradiční
problematiku zálohovacích a záznamových zařízení a související
oblasti. Zastavíme se u některých nebezpečí na naše data
číhajících -- z nichž část zcela určitě představuje novou generaci
problémů, a povšimneme si několika supermoderních trendů
zálohování -- jako je Backup over Net -- které se nabízejí
našim vyspělejším sousedům.



Zálohování a bezpečnost dat je samozřejmě poměrně častým hostem
na stránkách počítačových časopisů, i když se nedá říci, že by
šlo o oblast obzvláště dynamické růstu a změn (přinejmenším pokud
pomineme poněkud chaotickou oblast aktivní ochrany privátních
informací). Je to prostě téma příliš závažné a občas i bolestné,
aby se dalo ignorovat delší dobu.
Ke ztrátám dat může dojít docela snadno -- snadněji, než si běžný
uživatel představuje. Samozřejmě je si třeba přiznat, že lidé
(konzultanti, autoři článků a spol.) mají podstatně větší zorné
pole -- s poruchami všech možných typů se setkávají podstatně
častěji než běžní uživatelé -- a z toho možná vyplývá jejich
zdánlivě či očividně přílišný pesimismus. Ale jsou to právě oni,
kdo se tato data snaží pro vás zoufalce zachraňovat během
dlouhých zimních nocí, a potom ještě musí zdůvodňovat, proč se
jimi vystavená faktura nápadně blíží schodku státního rozpočtu.
Ano, popisované katastrofické scénáře nemusí být nutně adekvátní
nebezpečím, číhajícím na jedince pracující v silně omezeném
prostředí jednoho počítače a určité limitované sady softwaru.

Nová doba, nová nebezpečí

Stále ale platí, že optimismus -- pokud jde o výsledky vaší
usilovné práce -- se nevyplácí. Postačí jeden přehlédnutý vir,
a z vašich souborů může být během půlhodiny jeho činnosti
naprostá binární kaše. Viry jsou dnes nejběžnějším původcem
problémů (chová se váš počítač nepředvídatelně, spouštějí se
programy pomaleji a pomaleji, zhoršuje se stabilita systémů,
mizí vám soubory, píše vám něco vzkazy na obrazovku?) a situace
se zatím nejeví stabilizovaná. Příchod nových systémů sice
přináší uživatelům jisté odlehčení -- čím je systém
strukturovanější a komplikovanější, tím je pro vir obtížnější
chovat se nepřístojně. Stačí to demonstrovat na Windows NT či
Mac OS, kde je -- i pokud bereme v úvahu menší procentuální
zastoupení -- virů minimálně. A nemůžeme to svádět na to, že
známá bulharská velkovýrobna antikapitalistických virů zavřela
krám.
Právě nadchází doba nového typu dokumentů, kterým bylo dáno do
vínku interaktivní chování. A tady se otevírá příležitost pro
něco dříve nemožného -- plně crossplatformní viry, nezávisející
na hardwarové a systémové platformě. Jestliže je možné do
dokumentu začlenit procedury plnokrevného programovacího jazyka,
které jsou automaticky spuštěny při otevření tohoto souboru
mateřskou aplikací (Microsoft Wordem apod.), nic jim teoreticky
nemůže bránit v replikaci, "úpravách" aplikací atd. Pokud vám
tedy přijde dokument s makrovirem, jenž zdánlivě provede při
otevření dopisu něco užitečného -- přeformátuje odstavce či co --
může vytvořit ve vašem programu makro ukládací, které bude
makrovir dále šířit a současně poškozovat ukládané soubory.
Samozřejmě, antivirová aliance výrobců již dávno zareagovala
a většina lovců virů umí lovit i ty založené na makrech. Makra
totiž nemohou (zatím) používat maskovací techniky a jsou vždy
a nutně v souborech viditelná. Na druhé straně, vyhledávání
neznámých makrovirů je obtížné -- to bychom totiž museli
"strojově" analyzovat příkazové sekvence, zda nehodlají provádět
něco potenciálně nebezpečného. Nejjednodušším krokem je tak dnes
prostě provádění maker zakázat, protože jen málokdy mají něco
společného s vlastním obsahem.
Zmínili jsem příchod nové generace operačních systémů (kde
Windows 98 a NT 5.0 či Rhapsody jsou jen logickým navázáním). Ty
leccos mění, a často je to pod úrovní pozornosti běžných uživatelů.
Na jedné straně přinášejí vyšší celkovou spolehlivost a tedy
i ochranu dat -- ať už formou modernějších souborových systémů či
prostě důkladnějšího separování uživatelských a aplikačních
vesmírů. Novinkám ovšem vždy nějaký ten "servis pack" (čti
aktualizace) chybí k dokonalosti, a tak jsou ti nejranější
uživatelé vystaveni následkům chyb programátorů. Je pravda, že
systémy postupně nabízejí více a více utilit pro správu disků
a dat (viz defragmentace a IntelliMirror v NT 5.0). Jejich
souputníkem je ale něco hodně specifického a uživateli značně
podceňovaného -- rostoucí procento hůře recoverovatelných dat.

Záchrana dat -- mission impossible!

Podívejme se na problémy s daty z druhé strany. Pokud jste již
s daty něco provedli, smazali je, pustili na ně vira či se vám
skutečně nezaviněně něco zhroutilo, nebyl to dříve takový
problém. Dokud se disk tváří naformátovaně, pamatuje si velikost
svých oddílů a sem tam nějaký soubor ještě "ukazuje", stále ještě
není všechno ztraceno. Můžeme použít nějakou tu utilitu typu
Undelete či Disk Doctor a zmizelý soubor (data) znovu vrátit
na světlo uživatelské a systémové. Bohužel se tak stává jen
v ideálních případech, kdy jsme soubor smazali/poničili docela
nedávno, od té doby se příliš nepracovalo s dotyčným ukládacím
zařízením, a vůbec -- jste pod správným systémem. U řady
souborových systémů FAT, FAT32 (poprvé Windows 95 OSR2) , NTFS
(Windows NT) či dokonce DFS (Distributed File System, obecně až
NT 5.0) totiž postupně klesá možnost záchrany jednou ztracených
dat. K dispozici je menší počet diskových utilit a ze staršího
systému nemá smysl restartovat -- protože by novější formát disku
prostě ani neviděl.
Zůstat u FAT disků ovšem není také příliš strategické. Takový
NTFS je například "recoverable file system", který by měl
garantovat konzistenci adresářových struktur a systémových dat.
Podstatná je také jeho bezpečnost na úrovni "lidské" -- pokud ve
firmě pracujete pod velmi častou dual-boot konfigurací NT
Workstation, kde je bootovací oddíl disku FAT s přiinstalovaným
systémem DOS, můžete na ochranu soukromí svých dat zapomenout.
(A také ať zvednou ruku ti, kdo nemají heslo vůbec nebo používají
mezeru, "heslo" nebo své křestní jméno. Cože? Tak to raději
zvedněte ruku, kdo nikoli?!)
Toto stojí za připomenutí, protože uživatelé si velmi často
stěžují na neodvolatelně smazané soubory -- pokud ale nechcete,
aby příští uživatel téhož počítače pročítal starší prototypy
vašich milostných dopisů, jak byste to asi chtěli zařídit? To,
co tady vědomě musíte obětovat, je obnovitelnost vašich dat.
Posledním trendem v problematice obnovovaní ztracených dat je
růst jejich komplexnosti. U souboru typu txt prostě stačilo
podívat se na určitých sektor disku a přímo "vidět" blok textu.
Totéž se vám ale jen těžko podaří u PDF , kde je používaná
vnitřní lzv-komprimace a z části textu nemáte šanci přečíst nic.
Ozvěnu potíží s komplikovaností souborů můžeme najít i u běžného
importování, které se často stává vědou, pokud náhodou
nepoužíváte náležitě spolupracující verze dvou programů.
(U takových relačních databází navíc neimportujete jeden soubor,
ale několik propojených relačními vztahy!)

"Zazálohuj se, jinak nic nebude!"

Zkrátka a dobře, vaše data jsou ohrožena a žádná strategie kromě
zálohovací vás nemůže spolehlivě ochránit. (Raději zapomeňte na
firmu, která v podobě spásných andělů sestoupí ze Žlutých stránek
a ze 100 % vám data vrátí.) Za samozřejmou zde ovšem musíme
považovat přítomnost UPS (nepřerušitelný zdroj napětí), nebo
alespoň nějaké ,odstiňovače" poruch napájecí sítě, kde jsou ceny
určitě přijatelné. Moderní systémy dnes přímo podporují
komunikaci s UPS a mohou se například samy postupně vypnout
(a tedy uložit dat), pokud UPS již nezbývá mnoho sil. To si ovšem
vyžaduje komunikaci po sériovém portu a o něco chytřejší model
UPS -- podobné scénáře jsou ovšem důležitější pro servery, kde
uživatel typicky nebývá přítomen. Proto také moderní ovladače
umějí poslat oznámení o kritické situaci napájení třeba na pager,
mobil či e-mailovou adresu odpovídajícího správce.
Moderní UPS ovšem nemusí ihned zaskakovat za výpadky proudu,
většinou současně aktivně "průchozí" proud sledují a vyrovnávají
jeho kolísání. U počítačů jsou spíše ohrožena data výpadky proudu
než komponenty jeho kolísáním, kvůli používaným počítačovým
zdrojům. Moje zkušenosti ovšem ukazují, že vám nic -- a hlavně
UPS -- nepomůže, pokud vám zešílevší zdroj počítače pošle do
motherboardu o nějaký ten voltík navíc.
UPS však není jen otázkou počítačové techniky, ale toho, co má
pro vás hodnotu a co nechcete, aby vám místní -- ještě
předkomunistické -- elektrické vedení zničilo. Jakkoli to může vypadat
přehnaně, pokud vlastníte hi-fi techniku hodnoty vašeho osobního
počítače (a to se při dnešních cenách může stát snadno), měli
byste změnit názor. Často vůbec netušíte, co vám po kabelech
běhá. Pro představu: v pronajatém bytě byl tak poničený jistič
(už jste někdy vyjednávali s řemeslníky o výměně archaického typu
jističe?), že jeho prskání -- proudové pulsy -- dokázalo projít
i značkovou UPS a přepínalo funkce komponenty ve věži. Ale to je
zase úplně jiný příběh.
Pokud jste tedy v situaci, že můžete bezpečně dokončit uložení
práce na pracovní disk a pustit se do zálohování, nabízí se vám
celá řada možností. Principiálního se toho za poslední rok mnoho
nezměnilo, snad jen ty cenové relace jsou zase o něco
příznivější. Problémem zůstává spíše psychologická záležitost,
kde je to více otázka lidské energie než finančních prostředků.
K většině výměnných ukládacích zařízení se dnes naštěstí přidává
nějaký ten automatizační zálohovací software, který by měl toto
řešit. Ty nejpropracovanější se ale stále týkají jen velkých
firemních řešení s vlastními správci -- zrcadlená disková pole
spolupracující s nějakým tím hierarchickým managementem dat
(podle četnosti potřeby přesouvá data mezi několika různě
rychlými a spolehlivými zařízeními) jsou dnes stále typičtější,
i když ne příliš levnější a přístupnější pro malé a střední
firmy.
Jinde je to naopak podstatně optimističtější. Zip Drive se stal
standardem, počítadlo kousků již překročilo 12 mil. a v únoru
Iomega získala prvního oficiálního OEM partnera -- firmu
Dell. Ceny médií by měly klesnout, protože firma Nomai vyhrála
spor o práva na jejich výrobu. Relativně nedávno si Iomega
uškodila zamlčováním informací o spolehlivosti svého hardwaru --
které vyvolaly hotovou bouři pověstí a utišilo je až uveřejnění
"jednoprocentní" chybovosti mechanik. Ale ani takto propracované
marketingové "zohavení" již dnes Zipu prostě nemůže ublížit.
Firmy jako Micron v celé řadě počítačů, nebo třeba IBM v japonské
řadě AptivaPC, již disketovou mechaniku definitivně eliminovaly!
Podstatně typičtější zálohovací médium -- páskové mechaniky -- se
již dlouho drží na cenově přijatelných hladinách. Vývoj probíhá
spíše v těch výkonnějších, kde např. DLT mechaniky (Digital
Linear Tape, hlava je nepohyblivá a kolem sviští pásek rychlostí
120 palců za sekundu) dnes nabízejí datové toky až 10 MB/s, ovšem
za značnou cenu (finační, velikosti celé mechaniky apod.) Pro
grafika, jehož jedno hodinové pohrání si s digitalizační kartou
vyprodukuje 10 GB dat, opět stále nic moc. DLT ovšem existují již
od roku 1994 a zůstaly dodnes v rukou jediného OEM výrobce. Od
téhož roku mimochodem existuje přece jen akceptovanější páskový
standard Travan (firmami v pozadí byly Hewlett-Packard, 3M, Sony,
Conner a Iomega).
Podobný vývoj platí i o MO (magnetooptických jednotkách), kde se
stále mluví o průlomu, který konečně dotáhne jejich vítězství nad
klasickými pevnými disky až dokonce. Prozatím ale nic takového
nehrozí a z vývoje mohou těžit opět spíše provozovatelé
mohutnějšího datawarehousingu, kteří se mohou opřít
o spolehlivější a levnější (proti minulosti) MO knihovny.
Spor CD-R (či CD-RW) a DVD-R se dnes jednoznačně odkládá do
příštího roku (ale spíše tisíciletí). Po mnoha proklamacích
stále počítačové DVD žádný extrémní boom neprožívá a reálně
dostupné DVD-R (DVD-RAM) mechaniky nadále existují jen
v tiskových prohlášeních a na rýsovacích prknech společností,
jež se stále neráčily dohodnout na jednotných formátech.
Nástup CD-RW dnes zdržuje jen neúměrná cena médií (cca 15x více
než CD-R). Přitom to je právě CD-RW a technologie packet-writing
(logický následovních zapisovacích způsobů disk-at-once
a track-at-once), které umožňují zálohování na disky CD-RW přes
síť!

Backup over Net

Posledním dnes zmíněným zálohovacím principem je "Backup over
Net", skutečná můra futuristů, kteří už nevědí, co by
předpověděli, aby se to nestalo do dvou let skutečností. (Viz PC
WORLD 12/96, článek "Virtuálně o virtuální realitě", i když tam
se mluví i o "vzdálených" pracovních discích.)
Jak sám název napovídá, stále více firem ve Spojených státech
může využívat služeb zálohování přes Internet, označovaných také
jako "Web backup service". Podle průzkumu dnes na Internetu
přibývá 625 TB (ano, terabajtů) dat měsíčně, a tak není důvodu,
proč by se tam nenašlo něco místa pro ta vaše.
Stačí zaplatit poplatek (na megabajt, za čas připojení nebo
paušál) a "prostě" odeslat svá data na servery firmy, která je
proti všem případným potížím s dlouhodobou úschovou dat
zajištěna. Data jsou automaticky kódována algoritmy DES (až 160
bitů, podle firmy), služby jsou 24 hodin on-line a data je možno
kdykoli restaurovat -- bez ohledu na arabské teroristy, kteří
právě naprosto vymazali vaši firmu i s počítačovým vybavením.
Pokud vám právě (viz předchozí důvody) nefunguje síťové spojení,
do 24 hodin po území Států, vám docestuje CD-ROM(y) s potřebnými
daty.
Hlavním (naším) problémem tu zůstává rychlost připojení. Zatímco
po ISDN můžete za hodinu zazálohovat cca 56 MB, aby tyto služby
měly smysl, stále by to přece jen chtělo T1 nebo podobně rychlé
připojení. Teoreticky (s kartou Visa v ruce) by šlo s podobným
vybavením tyto služby využívat i u nás, protože Internet tu
skutečně boří hranice, ovšem vzhledem k propustnosti jeho
evropské páteře jen těžko dosáhnete takto rychlého kanálu napříč
zeměkoulí až do USA. Uvidíme, jak se tato situace vyvine u našich
sousedů. (U nás, obávám se, se v nejbližší době nevyvine.)

Zapletalův dodatek k Murphyho zákonu §3564: Mohou-li se věci
pokazit, dříve nebo později se také pokazí. K podmínkám platnosti
tohoto tvrzení přitom patří, že "později" není od "dříve" příliš
časově vzdáleno a že se pokazit může všechno. Jestliže jste se
právě rozhodli, že budete zálohovat, je zřejmé, že již v tomto
okamžiku bylo něco neodvratně ztraceno či zničeno.

Byl pro vás článek přínosný?