PCDIY!業界新聞

NVIDIA DGX A100 開始出貨,將全球最先進的人工智慧系統用以對抗新冠病毒肺炎,第三代DGX挾帶破紀錄的5Petaflops人工智慧效能

(本資訊由廠商提供,不代表PCDIY!立場) 2020-05-15 12:56:26

將訓練、推論與資料分析統整至單一平台,每套系統可配置 1 到 56 個獨立的 GPU,帶來靈活、軟體定義的資料中心架構

NVIDIA (輝達) 今日揭曉第三代的全球最先進人工智慧 (AI) 系統 NVIDIA DGX A100,除了可提供 5 Petaflops 的 AI 效能,並首度把整個資料中心的運算力與功能整合至具靈活性的單一平台。

即刻上市的 DGX A100 系統已全球出貨,第一筆訂單來自美國能源部 (DOE) 的阿貢國家實驗室 (Argonne National Laboratory),該實驗室將運用該叢集的 AI 與運算力,進一步瞭解並對抗新冠病毒肺炎。

NVIDIA DGX A100


NVIDIA 創辦人暨執行長黃仁勳表示:「NVIDIA DGX A100 是專為先進人工智慧設計的終極工具。NVIDIA DGX 是第一個為了端到端的機器學習作業流程而打造的 AI 系統,從資料分析、訓練到推論皆可運用。借助最新 DGX 強大的效能躍進,機器學習工程師能在以指數型成長的 AI 模型和資料規模中保持領先。」

DGX A100 系統整合八個全新的 NVIDIA A100 Tensor Core GPU,提供 320GB 的記憶體以訓練最大型的 AI 資料集,與最新的高速 NVIDIA Mellanox HDR 200Gbps 互連。

NVIDIA DGX A100內部元件


透過運用 A100 的多執行個體 (multi-instance) GPU 功能,可將每套 DGX A100 系統分割成多達 56 個執行個體,以加速處理多個小型的作業負載。結合這些功能,企業可根據需求優化其運算力與資源,並在單一且完全整合、軟體定義的平台上加速多樣化的作業負載,包括資料分析、訓練與推論。

DGX A100 即刻採用與支援

若干全球最大型的企業、服務供應商與政府機構已初步下訂 DGX A100,而第一套系統已在本月稍早出貨給阿貢國家實驗室。

阿貢國家實驗室運算、環境與生命科學副主任 Rick Stevens 表示:「我們使用美國威力最強大的超級電腦來對抗新冠肺炎病毒,並在諸如 NVIDIA DGX A100 等最新的技術上運算 AI 模型並進行模擬。DGX A100 系統的運算威力將協助阿貢國家實驗室的研究人員探索治療方法與疫苗,並研究病毒的傳播,讓科學家得以在幾個月、甚至幾天內就完成數年的 AI 加速作業負載。」

佛羅里達大學將是首間收到 DGX A100 系統的美國高等學府,而該校也將運用它將 AI 納入所有的課程中,以培養其人員使他們具備 AI 能力。

佛羅里達大學校長 Kent Fuchs 表示:「佛羅里達大學擁有成為全國人工智慧領導機構的願景,而 NVIDIA 正是我們在追求這個目標上非常有價值的夥伴。我們全新的 NVIDIA DGX A100 系統將橫跨各個學科,促使我們的研究人員解決全球最迫切的挑戰,並賦予整個世代的學子為未來的勞動力帶來革命性進展的技能。」

初期採用 NVIDIA DGX A100 系統的單位包括:

● 生物醫學人工智慧中心 (The Center for Biomedical AI) :位於德國漢堡埃普多夫大學附設醫院,將利用 DGX A100 推進支援臨床的決定與流程的優化。
● 朱拉隆功大學 (Chulalongkorn University):泰國進行密集研究首屈一指的大學,將使用 DGX A100 來加速開創性研究,如泰語自然語言處理、自動語音辨識、電腦視覺與醫療影像等。
● Element AI:位於蒙特婁的 AI 驅動解決方案與服務的開發商,正部署利用 DGX A100 為其Orkestrator GPU 排程器加速效能與功能優化,以因應持續成長的 AI 訓練與應用需求。
● 德國人工智慧研究中心 (DFKI) :將使用 DGX A100 系統進一步加速其對於深度學習的新方法及相關解釋性的研究,同時顯著降低空間與能源的消耗。
● Harrison.ai:總部位於雪梨的健康照護 AI 公司, 將部署澳洲第一套 DGX A100 系統,以加速其AI 做為醫療裝置 (AI-as-medical-device) 的開發。
● 阿拉伯聯合大公國人工智慧部:第一家在中東部署全新 DGX A100 的單位, 打造國家級架構以加速 AI 在公部門與民間企業的研究、發展與採用。
● VinAI Research :越南領先業界的 AI 研究實驗室,位於河內與胡志明市, 將使用 DGX A100 進行高影響力的研究並加速 AI 應用。

數千套的前一代 DGX 系統目前在全球各地的各種公共機構與民間企業被廣泛使用,其中包含許多全球的領導企業,如汽車業、健康照護供應商、零售商、金融機構與物流公司,都在其各自的產業領域中推動 AI。

NVIDIA 打造 700 Petaflops 的次世代 DGX SuperPOD

NVIDIA 同時也揭露其次世代的 DGX SuperPOD,這是一套由 140 個 DGX A100 系統構成的叢集,可達到 700 petaflops 的 AI 運算威力。NVIDIA 藉由結合 140 個 DGX A100 系統與 NVIDIA Mellanox HDR 200Gbps InfiniBand 互連,打造出次世代的 DGX SuperPOD AI 超級電腦,提供像是對話式 AI、基因組學與自動駕駛車領域的內部研究使用。

此叢集是全球速度最快的 AI 超級電腦之一,並達成之前需要數千台伺服器才能達到的效能水準。DGX A100 企業級的架構與效能讓 NVIDIA 得以在一個月內就打造出這套系統;反觀之前若要達到此等超級電腦的等級,則必須花費數個月、甚至數年時間進行規劃並採購特定元件。

為了協助客戶打造屬於他們自己由 A100 驅動的資料中心,NVIDIA 已發表全新的 DGX SuperPOD 參考架構。這個架構提供客戶一幅藍圖,以便遵循 NVIDIA 打造這個基於 DGX A100 AI 超級電腦叢集所使用的同一種設計原理與最佳作法。

DGXpert 計畫與 DGX-Ready 軟體

NVIDIA 同時推出 NVIDIA DGXpert 計畫,連結 DGX 客戶與 NVIDIA 的 AI 專家。此外,NVIDIA 的DGX-Ready 軟體計畫,亦協助客戶在 AI 工作流程中運用經驗證的企業級軟體。

DGXperts 是嫻熟 AI 的專家,他們從計劃、落實到持續的優化,都可以協助指導客戶進行 AI 部署。這些專業人員可以協助 DGX A100 的客戶打造與維護最先進的 AI 架構。

NVIDIA 的 DGX-Ready 軟體計畫協助 DGX 的客戶快速找到並運用經 NVIDIA 測試過的第三方 MLOps 軟體,以幫助他們提升資料科學的生產力、加速 AI 工作流程,並提升可存取性與 AI 架構的運用。NVIDIA 第一批認證的計畫合作夥伴包括Allegro AI、cnvrg.io、Core Scientific、Domino Data Lab、Iguazio 與 Paperspace。

DGX A100 技術規格

● 8個 NVIDIA A100 Tensor Core GPU,可達 5 petaflops的 AI 效能,總 GPU 記憶體達 320GB,頻寬高達每秒 12.4TB。
● 6個 NVIDIA NVSwitch 互連網路,並運用第三代 NVIDIA NVLink 技術達到每秒 4.8TB 雙向頻寬。
● 9個每秒 200Gb 的 NVIDIA Mellanox ConnectX-6 HDR 網路介面,提供總計每秒高達3.6Tb 雙向頻寬。
● 透過 NVIDIA Mellanox 的網路內運算 (In-Network Computing) 與網路加速引擎,如 RDMA、GPUDirect、可擴充式階層聚合 (Scalable Hierarchical Aggregation) 及 Reduction Protocol (SHARP),帶來最高的效能與擴充性。
● 15TB Gen4 NVMe內部儲存器,比Gen3 NVMe SSD快2倍。
● 由 NVIDIA DGX 軟體堆疊所驅動,其中包括供 AI 與資料科學工作負載使用的優化軟體,達成極大化的效能,並讓企業在 AI 架構的投資能更快獲得回報。

由五套 DGX A100 系統組成的單一機架就可以取代供 AI 訓練與推論架構使用的資料中心,耗電量只需要20分之1,且只佔原本25分之1的空間,而成本更只有原來的10分之1。

搭載 NVIDIA DGX A100 的 NVIDIA DGX SuperPOD


上市時程

NVIDIA DGX A100 系統售價美金 199,000 元起,並可透過 NVIDIA 的全球經銷合作夥伴訂購。包括 DDN Storage、戴爾科技 (Dell Technologies)、IBM、NetApp、Pure Storage 與 Vast 等儲存技術供應商,都計劃把 DGX A100 整合進他們的產品,其中包括基於 NVIDIA DGX POD 與 DGX SuperPOD 參考架構的產品。

NVIDIA DGX-Ready 的資料中心夥伴在全球 26 個國家、超過 122 個地點提供代管服務,以協助追求高成本效益設備的客戶代管 DGX 架構。DGX A100 的客戶將能利用這些服務,在驗證過的世界級資料中心設施內儲存與存取 DGX A100 架構。

包括詳細技術規格與訂購詳情的更多訊息,請造訪 www.nvidia.com/DGXA100。

發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。