新聞中心
發布日期:2022.10.17

國衛院啟用 NetApp AFF A800,為生醫 AI 平台建立快速且流暢的資料傳輸通道

出處:iThome

 

 

「我認為 NetApp AFF A800 最大優勢,在於擁有優異的資料儲存與分享效率,並擁有高穩定度,且只要我們拋出問題、NetApp 都能快速回應。這些特質,足以帶給國衛院充足信心,未來不論承載多麼龐大複雜的基因資料庫,也無所畏懼。」

 

——— 國衛院群體健康科學研究所所長 邱弘毅

 

人體基因如浩瀚無垠的宇宙,含有 30 億個 DNA 鹼基對,蘊藏許多未知密碼,對個人健康影響至鉅,等著我們去探索與解構。因此近年生醫界積極投入「次世代基因定序」(NGS),期望爭取時效,從大量鹼基對中挖掘各種疾病的關鍵線索。為加速 NGS 發展,讓精準醫療願景及早實現,且進一步促成新藥開發、疾病預測的突破性發展,國家衛生研究院(以下簡稱『國衛院』)於今年啟動「AI 生醫資訊創新研究暨應用服務中心」建置計畫,期望打造如臺灣版「劍橋一號」般的生醫超級電腦。

 

正所謂萬丈高樓平地起,欲使生醫超級電腦落地實現,有賴各項基礎元素的到位,除要有豐沛的 GPU 計算資源,及負責資源管理與協調的雲端平台外,還要有兼具高吞吐量、高擴充性的強大儲存設備。鑒於此,國衛院選擇部署 NetApp AFF A800,為 AFF 系列中最高階的全閃存陣列。

 

國衛院群體健康科學研究所所長邱弘毅形容,若將 AI 平台比喻為烹煮絕世佳餚的頂級廚房,則 A800 就是先進的大冰箱,藉由內部的優異配置,讓廚師們(研究員)都能快速方便地取出所需食材;足見儲存設備之於整個 AI 環境建置,著實扮演重要角色。

 

NetApp AFF A800 導入效益

  1. 單座 A800 可縱向擴充至最大 6.6 PB 容量,亦可並聯多座 A800,擁有極高擴展性,可幫助國衛院適時強化研究計畫的承接力道
  2. 有效消除從邊緣、核心到雲端的瓶頸,讓大量資料從不同位置順暢無阻地流向 AI 基礎建設,加速執行訓練
  3. 可瞬間將同一份資料集產生大量資料副本,以因應不同研究專案或模型的運用需求

 

讓資料如同活水,迅速流向 AI 伺服器

邱弘毅表示,國衛院為國家智庫,今後有許多關於生醫健康的國家級資料庫,將逐一進駐到國衛院平台,這些數據的量體龐大,架構多元複雜,因而需要具有高強計算力、專門承擔生醫研究任務的超級電腦,負責從龐大複雜的資料解析人類的健康密碼。

 

國衛院目前打造的生醫專屬超級電腦,由六台 NVIDIA DGX A100 伺服器構成。因國衛院未經營醫院,與各醫療院所無利益衝突,很適合成為超然中立的 Hub 中心,匯集(Pooling)國內各個生醫資料庫,同時採取開放態度,以透明、公開、公正的遊戲規則,鼓勵大家發想好的研究題目,帶到國衛院 AI 平台執行運算;意謂其他單位不需重覆投資,共用國衛院 AI 基礎建設即可。

 

「如罕見疾病,任何醫院的資料量都不大;一旦有了國衛院平台,便可集結願意參與研究的多家院所,把他們的資料彙整起來,提供給研究者使用,」邱弘毅說,現有 NVIDIA FLARE 聯邦式學習框架可供運用,今後即便進行跨院研究,也不需要搬動原始資料。儘管如此,國衛院仍需借重強大的中繼儲存,負責架設最順暢無阻的傳輸途徑,確保前端 NVIDIA DGX A100 伺服器,都能以最快速度接收到訓練資料集,演算完畢後,再以最快速度將 AI 模型歸檔至資料庫。

 

NetApp 為享譽全球儲存業界的知名品牌,針對資料的儲存與傳輸擁有多項獨家技術,且與三大國際公有雲有緊密合作關係;因此國衛院看好 A800 有能力消除 AI 基礎架構的障礙與瓶頸,讓訓練 AI 演算法所需資料,如同活水,在邊緣、核心及雲端之間迅速流動。

 

以 FlexClone 瞬間產生多份資料副本,支應不同研究案

過去 20 多年來,臨床試驗一直是新藥開發的金科玉律,但近年隨著大數據技術崛起,生醫界開始藉由 Real World Data(RWD),檢視病患服用癌症藥後的存活期,竟發現與藥廠宣稱的療效多所落差。顯見經過完美控制的臨床試驗情境,碰上真實世界的干擾因素,可能讓藥物療效產生變化;故現今越來越多藥廠在開發新藥時,既會執行臨床試驗,也會結合 RWD 進行印證。

 

隨著 RWD 趨勢成形,可預見未來單一研究案涉及的資料量體勢必擴大,且其中同時摻雜結構化資料、非結構化資料及串流資料。因此國衛院致力打造開放平台架構,希望網羅全球資料,突顯儲存設備更形重要,尤其傳輸速度一定要快,才有助於前端加速孕育 AI 模型,而 A800 便具備這般效果。

 

儘管國衛院的 AI 平台正在進行最後測試與優化,即將啟動第一階段任務、承接院內計畫,換言之國衛院與 A800 相處至今的時間不長,但邱弘毅和他的同仁們,已對它留下深刻印象。比方說 AFF A800 支援 NetApp FlexClone 技術,能透過Reference 概念、而非實際拷貝資料,瞬間將同一份資料產生大量資料副本,以利快速支應不同專案或模型的運用需求。

 

此外國衛院已訂閱英國人體生物資料庫(UK Biobank),由特定研究員負責下載相關資料,而他亦透過 NetApp 設備承載下載而來的數據。後來經邱弘毅請求,該研究員把若干資料傳送至 A800,等於在兩座 NetApp 設備間移轉資料,結果在 NetApp 資料遷移工具及壓縮技術助陣下,展現極高傳輸速率,令許多同仁備感驚艷。

 

截至目前,國衛院為 A800 配置 200TB SSD 磁碟,距離單座設備最大縱向擴充上限 6.6 PB,尚有很大空間。惟依照國衛院的規劃,此 AI 平台並非僅用於院內,待至未來第二、三階段,執行範圍將依序延伸至國內學研機構、國內外生技或製藥產業,屆時承擔的任務更加吃重,故預期 A800 仍有擴展需求。所幸它擁有極高擴充性,不但可縱向擴充至 6.6 PB,還能透過橫向擴展,將多座 AFF A800 並聯為單一叢集,藉以提升 IOPS 效能,為國衛院帶來更多擴充選項。