今年七月,雲端網絡安全公司 CrowdStrike 因更新系統導致全球微軟 Windows 裝置故障,引致全球金融、旅遊業等無法運作,航空公司取消大量航班,旅客滯留機場,損失慘重。事件發生後,雖然供應商都會立刻提供補救措施,卻要 IT 人員手動逐一操作、重啟系統,因而拉長 RTO(最短復原時間目標)。一旦 RTO 過長,就無法迅速解決營運中斷問題,繼而引發多種負面影響,如生產力下降、財務損失、合規風險,甚至可能嚴重損害企業聲譽,進而導致客戶流失。面臨系統隨時中斷的可能性,企業應做好心理準備並要確保備份管理簡易操作。
面對系統突然中斷,要將負面影響減到最低,Synology 提出建議:企業首先要重新檢視當前的數據備份解決方案,是不是能滿足事故一旦出現馬上還原的需求,這涉及到該解決方案的易用性,包括是否有提供單一且集中管理的介面、能否隨時還原跨站點的備份數據等,都影響 IT 人員日常維護,還有即時復原的效率。
事實上,企業光有備份仍不足夠,還應制定完整的災難復原策略,當中包括五大要點:
1. 不容許數據孤立存在:跨平台或跨工具運作是當今企業慣常情況,但當某些工作負載被忽略或未有保護,突然停機或無法運作時就有可能影響整體企業營運。因此,企業規劃備份時,不允許有任何數據孤立存在,務必將各種來源、裝置都要定期執行備份。
2. 定期進行還原演練:設備故障、系統癱瘓無法預知,所以必須持續測試、演練備份數據是否可還原,同時檢查還原計畫是否有效及容易操作,若察覺到漏洞就要立即修復,災難實際發生時才能順利重啟營運。
3. 即時虛擬機還原:一旦遇到停機意外,首要目標就是確保營運不中斷。為了將停機時間減到最少,建議透過虛擬方式即時轉換服務,以最快速度回復營運。
4. 跨平台還原:企業必須確保備份環境具備跨平台還原的能力,當單一平台出現狀況亦可選擇將服務還原到不同平台上,分散還原數據時所面臨的風險。
5. 提高異地備份與異地還原能力:除了擁有一份本地的備份,企業還需要異地備份,以分散風險。舉例來說,若企業採用雲端服務,並做好雲端異地備份的話,就能透過異地站點重啟服務,停機所帶來的損害便能減到最低。