AI 高樓數據起!HPE 多元 AI 儲存方案,助力加速智慧創新!
圖說:數據服務暨儲存方案事業群總經理蕭舜華(中)、HPE 數據服務暨儲存方案事業群產品經理郭宥均(左)
和數據服務暨儲存方案事業群資深技術經理吳銘哲(右)。 --- HPE
發布日期 : Aug 15, 2024
在堪稱科技界年度盛會之一的「HPE Discover 2024」大會上,HPE 偕同 NVIDIA 發表雙方聯手孕育的 HPE Private Cloud AI。兩家公司合作緣由,在於意識到 AI 技術流於碎片化、複雜化,衍生諸多風險與障礙,導致企業 AI 進程延宕,甚至危及數據資產;雙方一致認為企業需要藉助像是 HPE Private Cloud AI 的一站式方案,藉此化繁為簡,真正專注發展 AI 應用,而非深陷 AI 底層架構的整合泥沼。
HPE 數據服務暨儲存方案事業群總經理蕭舜華表示,HPE Private Cloud AI 為兼具算力、模型、數據三大主軸的一站式解決方案。關於算力,主要內容在於 HPE 對 NVIDIA 最新 GPU、CPU 與 Superchip 的支援。模型部分以 Ezmeral Unified Analytics 平台為主力,一來提供模型管理與維運功能,為資料科學家和資料工程師帶來 MLOps 綜效;二來提供 Orchestration 機制,實現 GPU 虛擬化目標。HPE 另提供 Ezmeral Data Fabric 軟體,能以單一命名空間(Namespace)支援雲地不同位置的多元類型資料,形成統一資料平台。
至於數據,堪稱 HPE Private Cloud AI 中至關重要的一環,因為企業必須善用大數據,才能訓練最佳模型。為此 HPE 發展多樣性 AI 儲存方案,協助企業在空間、效能、成本取得平衡,得以因應不同 AI 生命週期(依序為資料收集、資料準備、模型訓練、模型推論階段)、不同 AI 工作負載展開最佳投資布局。
多元AI儲存方案,與各類AI 工作負載完美匹配
HPE 數據服務暨儲存方案事業群資深技術經理吳銘哲指出,有關前兩個 AI 工作階段,資料收集需有大空間收納海量原始資料(Raw Data),資料準備涉及清洗、標註作業,執行較多讀寫,對存取效能有較高要求。惟綜觀兩階段的演算需求,都不必然需要啟用 GPU,故多數用戶傾向搭建效能適中、經濟實惠的儲存池。
至於後段的模型訓練和推論階段,對效能的要求明顯增高,皆需仰賴 GPU 算力,用戶有必要配置支援 NVIDIA GPU Direct Storage(GDS)協定的儲存系統,使 GPU 直接讀取資料,藉以降低延遲、實現高速平行運算。
吳銘哲說,另由於不同模型,適用圖檔、影像、音訊、文字不同資料型態,資料量差異甚大,所需資料空間大小當然不同。基本上除文字型態的模型外,其餘大型訓練工作皆需數百 TB 以上空間,單靠本機磁碟(Local Disk)並不足以承載,須部署外部分享式儲存設備。此外,僅靠本機磁碟對專案的管理及資源調配共享也非常困難。
為滿足各類情境對儲存效能、空間、成本的不同需求,HPE 悉心設計 3 套 AI 儲存方案。首先是 HPE GreenLake for File Storage(GL4F),HPE 透過 VAST 的技術移轉而催生 GL4F 作業系統,再將它搭載於新一代 HPE Alletra Storage MP。GL4F 採用獨特 DASE(Disaggregated Shared-Everything)架構,便於用戶依實際需要分別擴充控制器節點、儲存節點,享有最大擴展彈性。
值得一提 GL4F 支援 Similarity 演算法,針對 HPC 資料或已壓縮過的資料(如MPEG-4、JPEG),仍發揮 2:1 到 3:1 壓縮比的減量效果,使 All Flash 成本趨近 HDD-based 陣列,加上廣泛支援 GDS、NFS、SMB、S3 多元協定,得以達到效能與成本完美平衡,全面承載 AI 四大工作階段。
其二是兼具大資料量、中低速性能、節省總擁有成本(TCO)訴求的 Qumulo 方案;HPE 將 Qumulo 軟體整合於驗證過的自家儲存設備,讓用戶能以 SSD 快取搭配 HDD 儲存的配比結構,結合標準 NFS 存取協定,既可維持一定效能、又能降低建置成本,最適合承擔資料收集與準備任務。
第三則是為支援 GDS 協定、主打高速運算訴求的 Weka 方案,HPE 將 Weka 軟體整合在經過認證的全快閃陣列,組成 Turnkey 搭售組合,內含已配置完成的網路節點與軟體,幫助用戶快速搭建高速平行存取架構,滿足模型訓練與推論作業需求。蕭舜華強調,不論 Qumulo 或 Weka 方案,後續均由 HPE 扮演單一支援窗口。
藉由統一數據平台,消弭資料搬移負擔
某金控業者建立模型開發區,由模型伺服器利用 NFS、S3或CSI 協定存取後端 Teradata、Hadoop/Object 的大數據,再經過資料集整理與整合後,展開訓練工作。
該業者考量資料拖拉耗時,往往一等就是數小時,故委請 HPE 協助建立一個能整合訓練環境的統一數據平台。為此 HPE 規劃以 Ezmeral Unified Analytics 為核心搭建數據平台計算層,同時部署 Shared Storage,讓不同 GPU 伺服器、不同 Project 共同存取至單一數據平台。針對資料收集與準備,HPE 擬以 Qumulo 或 Ezmeral Data Fabric 打造高性價比的大數據共用區;另以 HPE GL4F 構築高速存取環境,支持 AI/ML 模型訓練與推論,或 GenAI 的 RAG、LLM 訓練等重度任務。
總之在資料為王時代,大數據是 AI 的關鍵燃料。因此 HPE 透過多元 AI 儲存方案,協助企業輕易實現效能、擴充性與成本的均衡,順勢強化 AI 生命週期管理效能,孕育偉大的智慧創新應用。
關於慧與科技股份有限公司 (Hewlett Packard Enterprise)
慧與科技公司(HPE)是邊緣至雲端的領導廠商,幫助企業從資料中萃取出有用的分析資料,加速創造業務成效。數十年來,HPE 致力於打造創新未來與創新的生活與工作方式。憑著這些經驗,HPE 開發出獨特、開放式且智慧化的技術解決方案,包含雲端、運算、高效能運算與 AI、智慧邊緣、軟體、及儲存,並為雲端與邊緣提供一致的使用經驗,幫助客戶開發及設計新商業模式、導入新方法,並提升操作效能。如需更多資訊,請至www.hpe.com/tw。
敦新科技身為 HPE 伺服器及儲存設備的專業代理商,提供 IT 投資解決方案幫助您轉型數位化業務,最新機種及服務歡迎洽詢 HPE 事業部: 02-8978-5386,或造訪: www.dawningtech.com.tw。