新聞中心
發布日期:2023.02.21

記得編列預算,做個多網站/雲容災吧!

出處:VERITAS 中文社區

 

年前,某大型雲平臺發生故障的消息不脛而走。時至今日,事件經過、前因後果已經發酵了一段時間,相信各位心中也自有判斷。

 

圍觀吃瓜之餘,讓我們回到問題的本質。當機,就像是那首經典的「夢醒時分」——早知道傷心總是難免的,你又何苦一往情深......逃不掉的,並且,這玩意和前面有沒有個「雲」字沒有半毛錢關係。

 

關鍵是,你的業務會因為潛在的當機遭受多大影響?有人說自己「三天後又是一條好漢」,也有的直接被打趴。無論如何,如人飲水,冷暖自知。真正承受壓力的永遠是那個「沒有 Plan B 的甲方」。

天命難違?時代的一粒沙,落在人身上,就是一座山。

信人不如信己,冗餘一下總是好的。申請點預算,做個多網站/雲容災吧!換成 IT 行業(準確地說是 Gartner)的「黑話」,就是 IT 彈性編排—— IT Resilience Orchestration(ITRO)。

 

Gartner 指出,IT 彈性編排解決方案旨在通過自動化災難恢復(DR)流程,同時降低災難恢復演習和災難恢復操作人員的成本,幫助提高因計畫外中斷而導致的工作負載恢復的可靠性、速度和細微性。相關工具集和方案主要側重於支持以下重點功能:

  • 自動化故障切換、回滾和可用性/連續性管理
  • 複製和編排
  • 發現、依賴關係映射和工作負載分析
  • 災難恢復管理和運行手冊創建
  • 報告和恢復驗證能力

說一千道一萬,對於企業而言,還是要回歸基礎中的基礎——充分理解 CSP 的「共用責任模型(Shared Responsibility Model)」,正應了那句時下最流行的"做自己健康的第一守護者"。

 

Veritas,InfoScale,Gartner,多網站,雲容災Veritas,InfoScale,Gartner,多網站,雲容災

 

介紹一些典型的應用場景,總有一款適合你。

  1. 跨本地和雲的應用程式雙向移動。如下圖所示:

    跨本地和雲的應用程式雙向移動
  2. 跨不同雲供應商的容災。如下圖所示:

    跨不同雲供應商的容災
  3. 可用區內的應用程式恢復,以 AWS 為例。如下圖所示:

    可用區內的應用程式恢復
  4. 跨可用區的應用程式高可用(使用複製)。如下圖所示:

    跨可用區的應用程式高可用
  5. 跨區域的應用程式高可用(使用複製)。如下圖所示:

    跨區域的應用程式高可用
  6. 通過 VBS 管理多層應用程式編排。如下圖所示:

    通過VBS管理多層應用程式編排
  7. 在雲中實現更高的存儲效率。如下圖所示:

    在雲中實現更高的存儲效率
  8. InfoScale 支援的多雲高可用/容災示例,如下圖所示:

InfoScale支援的多雲高可用/容災示例

 

難怪在 Gartner 關於 IT 彈性編排(ITRO)的用戶評價中,Veritas 是"總評論數 20 以上,且得分超過 4.3 分(滿分 5 分)"的「四大金剛」廠商之一。這裡再分享一些頗具代表性的用戶評價:

 

作為存儲/系統管理員,我們使用 Veritas InfoScale 提供高可用和災難恢復解決方案,保護關鍵業務服務免受計畫內和計畫外停機的影響。

 

InfoScale 是 Veritas 的拳頭產品,已有 20 多年的發展歷史。它解決了我們絕大部分資料管理和高可用問題。複製解決方案按預期工作,讓 IT 能夠輕鬆實現跨不同地理位置的、分散的網站複製。

 

內置卷複製,市場上最優秀的災難恢復解決方案之一。InfoScale 可與任何應用程式配合使用。起初有點複雜,但很容易習慣它的工作流程。

 

實施之前,必須做好計畫。InfoScale 是一個優秀的集群解決方案,支援關鍵業務應用程式在群集節點之間自動切換,工作非常穩定,IT 無需擔心應用程式停機。管理介面乍一看有點複雜,但擁有豐富的管理選項。花費一點時間,你將享受其中,經驗值突飛猛進。

 

最後,附一個在雲中進行災難恢復規劃時應遵循的步驟,供大家參考:

 

  1. 分析


    分析階段包括對組織現有 IT 基礎結構和工作負載的全面風險評估和影響分析。評估風險後,IT 部門可以識別潛在的漏洞和災難。

     

    然後,組織可以評估其當前基礎架構如何應對已識別的挑戰,並確定工作負載的 RTO 和 RPO。

  2. 實施

    實施階段有助於組織概述應對災難所需的步驟和技術。目標是制定一個計畫,使組織能夠在應對災難的同時迅速實施所有必要措施。此階段包含以下步驟:

     

    準備:解釋組織在災難事件期間如何回應的詳細計畫,包括明確的角色和職責。

    預防:這些是組織減少潛在漏洞和威脅的措施,包括員工培訓和定期更新。

    回應:組織為應對災難事件將實施的手動和自動措施。

    恢復:這些是手動和自動措施,可説明組織快速恢復恢復正常操作所需的資料。


  3. 測試

    組織需要測試其基於雲的災難恢復策略和計畫,並定期更新。這樣做有助於確保員工培訓充分,以及計畫不過時且有效。測試還可確保自動化流程和技術正常工作並隨時可用。此外,它還有助於檢測災難恢復解決方案中的差距。

    本質上,災難恢復策略應成為業務連續性計畫的一部分。應該針對端到端恢復進行設計,並包含確保組織正常運營所需的各個業務方面。

★ 敦新科技 VERITAS 產品試用專案現正實施中,即刻來信:Dw_veritas@dawningtech.com.tw