Важност плана за опоравак од катастрофе
План за опоравак од катастрофе је критичан елемент који свака организација треба да има успостављен, пре него што се суочи са непредвиђеним догађајем. У информационој технологији (ИТ) се креира формални документ који детаљно описује стратегије, радње и процедуре за управљање катастрофом и њеним последицама.
Катастрофа је изненадни догађај који може имати различите облике. Када се деси, појединци и организације суочавају се са бројним изазовима, укључујући финансијске проблеме и нарушавање корисничког искуства.
У случају напада, кључно је бити спреман да се минимизирају његови ефекти и брзо обнови нормално пословање. Ту на сцену ступа добро осмишљен план опоравка од катастрофе, који може помоћи у превенцији или ублажавању штете. Такође може смањити негативне последице у погледу корисничког искуства, трошкова и времена застоја.
Поред тога, неопходно је да ваши планови, особље, стратегије, опрема и системи буду спремни за брзи опоравак. Да бисте то постигли, неопходно је темељно разумети процес опоравка од катастрофе.
У овом чланку ћемо детаљно истражити ту тему, укључујући и кључне термине који се користе у процесу опоравка од катастрофе, како бисте били спремни да се ефикасно носите са таквим изазовима.
Кренимо!
Шта је катастрофа?
Катастрофа је непредвиђен догађај који се може догодити било где, укључујући и ИТ сектор. Може бити узрокована природним силама или људским фактором и може ометати пословање компаније, узрокујући поремећаје у инфраструктури.
Као последица тога, организација и њени клијенти, добављачи, запослени и партнери су погођени. То ствара притисак на организацију у виду финансијских губитака, нарушавања репутације, губитка поверења клијената и угрожавања безбедносне заштите.
Зато је неопходно унапред се припремити за овакве сценарије. За то је потребно брзо вратити све операције и податке. Једноставно речено, морате припремити своју организацију да све врати у нормално стање у најкраћем могућем року за ваше клијенте.
Катастрофе могу бити различите, као што су сајбер напади, саботаже, терористички напади, ransomware напади, физичке претње, урагани, земљотреси, пожари, поплаве, индустријске несреће, нестанци струје и многе друге.
Шта подразумева опоравак од катастрофе?
Опоравак од катастрофе представља процес враћања нормалног пословања након што је дошло до катастрофе. Ово укључује успостављање приступа хардверу, софтверу, опреми, комуникацији, умрежавању, напајању и подацима. Да бисте припремили организацију за катастрофу, потребно је дефинисати јасна правила и процедуре у оквиру документационог процеса.
Међутим, ако су објекти ваше организације оштећени, морате проширити своје активности на комуникацију, транспорт, набавку, радне локације и друге кључне области.
Зашто је план за опоравак од катастрофе важан?
Креирање ефикасног плана за опоравак од катастрофе, било да је узрокована природним факторима или људским деловањем, од виталног је значаја за сваку ИТ компанију. Важно је осигурати да имате одговарајуће особље и алатке на правом месту за глатку имплементацију плана.
Удубимо се у разлоге зашто је опоравак од катастрофе од кључног значаја.
Ограничавање штете
Катастрофе су непредвидиве. Нико не зна када ће се догодити. Међутим, можете се унапред припремити да контролишете штету нанесену вашој инфраструктури.
На пример, у областима које су подложне поплавама, можете поставити кључне документе и опрему на горње спратове како бисте избегли оштећење.
Слично томе, треба направити резервне копије важних података пре него што дође до сајбер напада, који може пробити безбедност података или их украсти.
Обнављање услуга
Ако имате добро осмишљен план за опоравак од катастрофе, повраћај свих услуга у њихово нормално стање биће брз и једноставан. То значи да у кратком временском периоду можете вратити већину кључне имовине и услуга.
Минимизирање прекида
Не можете знати шта ће се десити сутра или у следећем кораку вашег пословања. Али са ефикасним планом опоравка, не морате много да бринете о последицама. Ваша инфраструктура може наставити да ради са минималним прекидима.
Обука и припрема
ИТ инфраструктура укључује велики број запослених који раде под једним кровом. Сви морају бити упознати са процесом опоравка како би брзо реаговали у случају нужде.
Одговарајућа припрема ће такође смањити ниво стреса за све који су укључени у вашу организацију. Поред тога, можете обучити своје особље да предузме неопходне кораке у случају непредвиђених догађаја.
Терминологија за опоравак од катастрофе
Почнимо са терминологијом како бисмо боље разумели процес опоравка од катастрофе.
РТО (Циљно време опоравка)
Циљно време опоравка (RTO) је временски период који организација одреди у зависности од природе свог пословања, како би толерисала катастрофу без озбиљног утицаја на финансијски раст.
Приликом одређивања РТО-а, компанија мора да процени застоје који могу имати различите негативне последице. Користи се за развој одрживих стратегија за наставак пословања чак и након катастрофе. Када клијенти наиђу на потешкоће са апликацијом, питају се колико је времена потребно да апликација поново проради. Одговор на то питање је РТО за сваку организацију.
Пример: Претпоставимо да је ваша компанија платформа за онлајн трансакције, попут PayPal-а или Payoneer-а, која се суочава са непредвиђеним догађајима. У том случају, ваш РТО би требао бити довољно кратак да омогући брз опоравак.
Другим речима, компанија одређује свој РТО на сат или два како би избегла озбиљне финансијске или губитке података.
РПО (Циљна тачка опоравка)
Циљна тачка опоравка (RPO) представља губитак података који ИТ инфраструктура може да поднесе у погледу времена и количине информација.
Да ли је ово збуњујуће?
Узмимо за пример базу података која региструје банкарске трансакције, укључујући трансфере, заказивања, плаћања и још много тога. Када дође до катастрофе, база података се обнавља у реалном времену. У овом случају, разлика између базе података у тренутку катастрофе и повраћене базе података након катастрофе је нула.
За неке компаније је прихватљиво да треба око 24 сата да се поврате све информације из резервне копије, али то понекад може бити катастрофално. Неопходно је прилагодити своју инфраструктуру захтевима РПО-а. То укључује повећање учесталости резервних копија, додавање резервне базе података у вашу архитектуру и још много тога.
Прелазак на резервни систем (Failover)
Замислите ситуацију у којој путујете на дуге релације. Изненада, једна од гума на вашем возилу пуца из непредвиђеног разлога. Срећом, у вашем возилу се налази резервна гума и алати за замену оштећене.
Прелазак на резервни систем (failover) функционише на исти начин.
То значи да вам је током катастрофе потребна резервна веза. Укратко, прелазак на резервни систем значи да имате мреже и системе које можете користити у време катастрофе за пребацивање информација у систем за опоравак.
Прелазак на резервни систем осигурава да све ваше услуге раде без потешкоћа, чак и ако дође до кварова у инфраструктури или хардверу. На овај начин можете спречити губитак података и прихода за вашу организацију и избећи прекиде услуга за крајње кориснике.
Можете га подесити ручно или дозволити да функционише аутоматски како би се подаци пренели на резервни сервер.
Повратак на примарни систем (Failback)
ИТ повратак на примарни систем (failback) је једноставна операција у којој се оригинална производња враћа на првобитно место (систем) након што се катастрофа отклони. Током напада, компаније користе операцију преласка на резервни систем, која преноси сва радна оптерећења на резервни виртуелни сервер или други резервни систем.
Међутим, не можете прескочити следећи корак, а то је повратак на примарни систем. Када све обновите и поново покренете, потребно је да пренесете сва радна оптерећења на њихове оригиналне виртуелне сервере или системе. Овај целокупни процес преношења радних оптерећења на првобитно радно место или систем познат је као повратак на примарни систем. То је повратак на нормалан рад након напада.
Повратак на примарни систем се такође користи за планирано одржавање система. Истина је да се повратак на примарни систем увек дешава после преласка на резервни систем. Другим речима, прелазак на резервни систем је први корак, а повратак на примарни систем је други корак у опоравку кључних података. Може се подесити између облака и облака, локалног и локалног, локалног и облака или било које друге комбинације.
ДР (Опоравак од катастрофе)
Опоравак од катастрофе (ДР) је процес где се унапред креирају планови за опоравак кључних ресурса у одређеном временском оквиру.
ДР омогућава организацији да брзо реагује и обнови сваку услугу након непредвиђеног догађаја. Такође обезбеђује формалну документацију која садржи упутства за хитне акције у случају непредвиђених инцидената.
БЦП (План континуитета пословања)
План континуитета пословања (BCP) је један од најважнијих планова за опоравак од катастрофе, који омогућава ИТ инфраструктури да развије стратегије за управљање поремећајима на серверима, мобилним уређајима, персоналним рачунарима и мрежама.
БЦП се разликује од опоравка од катастрофе јер помаже организацији да креира планове за поновно успостављање пословног софтвера и продуктивности како би се задовољиле кључне пословне потребе.
У овом случају, компанија креира систем опоравка за превазилажење потенцијалних претњи, као што су сајбер напади или природне катастрофе. Дизајниран је да обезбеди кључне ресурсе и осигура да све услуге буду поново у функцији након катастрофе.
БЦМ (Управљање континуитетом пословања)
Управљање континуитетом пословања (BCM) је процес управљања ризиком, посебно дизајниран да делује као заштита од претњи пословним процесима. BCM је следећи корак након BCP-а, где се потврђују планови опоравка како би се осигурало да сви у компанији одмах реагују на план и обнове све битне ствари.
BCM делује као управљачки оквир за идентификацију ризика у инфраструктури када се суочава са спољним и унутрашњим претњама. Такође осигурава да оквир функционише ефикасно уз помоћ редовног тестирања како би се побољшала предвидљивост, смањио ризик и прилагодио план за будуће нападе.
БИА (Анализа утицаја на пословање)
Анализа утицаја на пословање (BIA) је процес анализе стопе преживљавања компаније кроз идентификацију кључних система, операција и процеса. Она показује утицај катастрофе на организацију због прекида у њеном пословању.
BIA предвиђа последице пре него што дође до напада, како би се прикупиле кључне информације које могу помоћи у креирању ефикасних стратегија за опоравак. Такође идентификује трошкове повезане са кваровима, као што су трошкови замене опреме, губитак протока готовине, профита, плата и још много тога.
Када креирате BIA извештај, морате узети у обзир кључне процесе који су укључени у ваше пословање, утицај прекида на различите области, прихватљиво трајање, финансијске трошкове и друге факторе.
Стабло позива
Стабло позива је процес састављања листе особља које треба позвати у хитним случајевима. То је процес који прати структуру стабла.
На пример, током катастрофе, једна особа контактира малу групу особља са хитном поруком, а онда то особље позива сваку групу засебно. На овај начин, сви запослени ће бити обавештени током претње и започеће свој задатак да на време врате све функције и процесе. Креирање листе је једноставно, али њено спровођење у реалном времену може створити потешкоће.
Морате спроводити редовне активности позива како бисте припремили све чланове особља за хитне случајеве да остану спремни. Редовно тестирање такође може помоћи да се идентификују промењени или недостајући бројеви, што може озбиљно утицати на перформансе.
Стабло позива садржи информације које се користе у хитним случајевима за испоруку упутстава. То се такође може урадити ручно, али људи користе аутоматизацију да убрзају процес и обавесте запослене у данашњем дигиталном свету.
Командни центар/Контролни центар
То је виртуелни или физички објекат који је посебно припремљен да обезбеди управљање и контролу над плановима за опоравак током кризе. Он комуницира са тимом за управљање системима и функцијама током катастрофе.
Традиционално, инфраструктура се ослањала на командни центар који се бави кризама без одговарајућег приступа. Данас су организације значајно унапредиле своје контролне центре, што чини брз одговор кључном компетенцијом.
Чим се детектује катастрофа, командни центар се брзо покреће ка фази опоравка. Поред тога, он служи као тачка за извештавање у случају услуга, штампе, испорука и још много тога. Такође окупља људе из различитих области током ових сценарија.
Одговор на инцидент
Одговор на инцидент је тип одговора који се даје како би се ублажио утицај напада. Ово се ради помоћу одговарајућих процедура и особља како би се ефикасно заштитила безбедност мреже и података у правом тренутку.
Ако организација има план за инциденте пре непредвиђеног догађаја, може заштитити своје податке од претњи у реалном времену. Специјалисти за реаговање на инциденте су увек будни у погледу проблема и делују промишљено током инцидента. Они предузимају неопходне кораке како би избегли кршење безбедности, водећи рачуна да не прескоче ниједан корак током опоравка од катастрофе.
Прво морате одредити критичне податке и складиштити их у облаку или на некој удаљеној локацији ради сигурности. Позабавите се тренутним потребама инфраструктуре и растућим сајбер претњама редовним ажурирањем планова за одговор на инциденте.
Резервна копија
Решења за резервне копије омогућавају ИТ инфраструктури да чува копије података и да их безбедно складишти у правом тренутку. Ако се суочите са оштећењем базе података, случајним брисањем свих података или неким другим проблемом, морате имати спремну резервну копију како бисте одмах вратили податке и наставили са услугама.
Ово укључује реплицирање датотека и њихово чување на безбедном месту, како би се лако приступило свим подацима након непредвиђеног догађаја. Корисно је ако направите резервну копију података на више локација како бисте били сигурни да их можете повратити, чак и ако једна локација закаже.
Отпорност
Способност заједница, држава, организација и појединаца да издрже или преживе катастрофу без угрожавања услуга и система позната је као отпорност на катастрофе.
Организација мора бити спремна да издржи велики ниво стреса због опасности. Осигурајте да имате могућности да минимизирате своје губитке бољим планирањем уместо да чекате да вас неко спаси. Ово ће вам помоћи да се прилагодите катастрофама и ефикасно опоравите своју ИТ инфраструктуру.
Овде је главни циљ очување и обнављање кључних функција и структура у правом тренутку, кад год је то потребно. Да бисте постали организација отпорна на катастрофе, морате се унапред припремити и имати способност да предвидите ризике, прилагодите се променама, делите и учите, интегришете различите секторе и управљате нивоима ризика.
SLA (Уговор о нивоу услуге)
Уговор о нивоу услуге (SLA) је план за случај катастрофе, у којем наводите крајњим корисницима време које вам је потребно за обнављање услуга у хитним случајевима.
SLA гарантује клијентима да су њихови подаци безбедни и да нису компромитовани или подељени са трећим лицима. То је једина тачка контакта у случају питања крајњих корисника.
Свака ИТ инфраструктура даје својим клијентима сигурност у погледу SLA. Дакле, побрините се да унапред комуницирате са крајњим корисницима.
SPOF (Једна тачка отказа)
Једна тачка отказа (SPOF) је део опреме, појединац, ресурс или апликација на коју су повезани многи други системи или апликације.
Ако такав део опреме или ресурса не успе, сви кључни делови повезани са системом нестају заједно са њим. Тиме ће бити погођен целокупан процес и пословање.
Због тога морате имати стратегију за решавање овог проблема, како бисте одржали своју организацију. Прва ствар коју можете да урадите је да идентификујете тај део опреме или систем који може имати велики утицај. Затим, извршите анализу утицаја на пословање и процените ризике како бисте били свесни могућих сценарија. Истражите и пронађите их пре него што се догађај деси.
Када наведете све SPOF, класификујте их према процесу опоравка. Ставите сваки SPOF у једну од три различите категорије:
- Опоравак је једноставан и директан, уз мање времена и буџета.
- Опоравак би био тежак, али се може развити поуздан процес за обнављање.
- Нема могућности опоравка у случају отказа.
Можете деловати у складу са тим на основу категорије.
Опоравак система
Током квара хардвера, морате покренути процес опоравка да бисте вратили одређени систем или сервер у његово првобитно стање. Да бисте опоравили цео систем, морате бити спремни са захтевима за опоравак, резервним копијама, компатибилношћу фирмвера и компатибилношћу хардвера.
Опоравак система је процес који ресетује машину на претходна подешавања или на исто стање у којем је била када је била нова. Ово ће избрисати све вирусне инфекције узроковане инсталираним софтвером или апликацијама на вашем систему.
Овај процес укључује планирање опоравка ИТ инфраструктуре, у којем се постављају и прате одређене процедуре како би се осигурала доступност података у случају поремећаја узрокованих људским фактором или природним катастрофама.
Враћање система
Враћање система је алат за опоравак који вам омогућава да вратите одређене датотеке и информације у њихово претходно стање у правом тренутку.
Помоћу враћања система можете вратити кључеве регистратора, инсталиране програме, управљачке програме, системске датотеке и још много тога на претходну верзију. Ово је веома корисно у многим ситуацијама.
План тестирања
План тестирања је документ који чува информације о стратегији тестирања, проценама, ресурсима, роковима, циљевима и распоредима. Он функционише као нацрт који покреће тестове како би се осигурала безбедност хардвера и софтвера.
Ово укључује различите тестове у складу са процедурама и корацима планираним за управљање последицама катастрофе. Спроводите редовне тестове како бисте припремили себе и своју организацију, и како не бисте пропустили ни један корак током акције. На овај начин, ИТ инфраструктура може разумети слабости и бити спремна за борбу.
Закључак
Нико не зна када ће се догодити катастрофа. Стога је одговарајућа заштита и сигурност неопходна за свако пословање.
Терминологија за опоравак од катастрофе ће вам помоћи да разумете како да реагујете на нападе и катастрофе. Такође ће вам помоћи да се припремите унапред како бисте могли да заштитите своју инфраструктуру током непредвиђених догађаја. Моћи ћете да креирате ефикасну стратегију опоравка од катастрофе у реалном времену, како бисте уштедели милионе долара и задржали поверење клијената.