PCDIY!業界新聞
AMD為科學研究發表全球最快HPC加速器,AMD Instinct™ MI100加速器以領先業界的運算效能為HPC與AI帶來顛覆性改變,首款採用全新AMD CDNA架構的GPU加速器為exascale等級時代量身擘劃
(本資訊由廠商提供,不代表PCDIY!立場) 2020-11-18 17:42:58
AMD(NASDAQ: AMD)發表全新AMD Instinct™ MI100加速器,為全球最快高效能運算(HPC)GPU,同時也是首款突破10 teraflops (FP64)效能的x86伺服器GPU。MI100加速器獲得戴爾、技嘉、HPE、美超微(Supermicro)等各大廠商的新款加速運算平台支援,結合AMD EPYC™ CPU以及ROCm™ 4.0開放軟體平台,旨在為即將到來的exascale等級時代推動全新發現。
AMD Instinct MI100 GPU採用全新AMD CDNA架構打造,搭配AMD第2代EPYC處理器,為高效能運算與AI開創出全新等級的加速系統。MI100在高效能運算方面提供高達11.5 TFLOPS的FP64尖峰效能,在AI與機器學習工作負載方面則提供高達46.1 TFLOPS的FP32 Matrix尖峰效能。透過全新AMD Matrix Core技術,MI100在執行AI訓練工作負載時能提供比AMD前一代加速器提升近7倍的FP16理論尖峰浮點運算效能。
AMD資料中心GPU與加速處理部門全球副總裁Brad McCredie表示,AMD推出AMD Instinct MI100,為全球最快的高效能運算GPU,代表著我們往exascale等級運算的目標邁進一大步。瞄準科學運算中最關鍵的工作負載,最新加速器搭配AMD ROCm開放軟體平台,兩強合併的組合為科學家與研究人員提供更為優越的高效能運算工作基礎。
橡樹嶺國家實驗室領導運算中心科學總監Bronson Messer表示,我們已經率先使用MI100加速器,初步使用效果讓人非常振奮。我們見證到大幅的效能提升,相比其他GPU高出達2到3倍。我們也同樣意識到軟體對效能影響的重要性。開源的ROCm開放軟體平台以及HIP開發者工具能在各種平台上運行,這是我們自推出首款混合CPU/GPU系統以來最關切的特點。
AMD Instinct MI100加速器的關鍵功能與特色包括:
• 全新AMD CDNA架構-AMD CDNA架構提供卓越的效能與功耗效率,為AMD GPU提供exascale等級時代的效能,同時也是MI100加速器的核心。
• 為HPC工作負載提供領先的FP64與FP32效能-提供領先業界的11.5 TFLOPS尖峰FP64 效能,以及23.1 TFLOPS的尖峰FP32效能,幫助全球各地科學家與研究人員加快在生命科學、能源、金融、學術、政府、國防等領域的新發現。
• 為HPC與AI開發的全新Matrix Core技術-針對全範圍單精度與混合精度矩陣運算提供大幅提升效能,其中包括FP32、FP16、bFloat16、Int8、以及Int4等,促進HPC與AI的融合。
• 第2代AMD Infinity Fabric™技術-Instinct MI100使用3個AMD Infinity Fabric™ Link時,可在PCIe® 4.0上提供約2倍的P2P (peer-to-peer)尖峰I/O頻寬,以及每張顯示卡高達340 GB/s的總頻寬。在伺服器中,MI100 GPU可配備兩個完全連結的Quad GPU單元(hives),每個單元可為高速資料分享提供高達552 GB/s的P2P I/O頻寬。
• 超高速HBM2記憶體-配備32GB高頻寬HBM2記憶體以及1.2 GHz的時脈頻率,帶來超高的1.23 TB/s記憶體頻寬,支援龐大資料集,協助消弭資料在記憶體存取時的傳輸瓶頸。
• 支援業界最新PCIe® Gen 4.0技術-配合最新版PCIe Gen 4.0技術進行開發,在CPU與GPU之間提供高達64GB/s尖峰理論傳輸資料頻寬。
AMD Instinct MI100 GPU採用全新AMD CDNA架構打造,搭配AMD第2代EPYC處理器,為高效能運算與AI開創出全新等級的加速系統。MI100在高效能運算方面提供高達11.5 TFLOPS的FP64尖峰效能,在AI與機器學習工作負載方面則提供高達46.1 TFLOPS的FP32 Matrix尖峰效能。透過全新AMD Matrix Core技術,MI100在執行AI訓練工作負載時能提供比AMD前一代加速器提升近7倍的FP16理論尖峰浮點運算效能。
AMD資料中心GPU與加速處理部門全球副總裁Brad McCredie表示,AMD推出AMD Instinct MI100,為全球最快的高效能運算GPU,代表著我們往exascale等級運算的目標邁進一大步。瞄準科學運算中最關鍵的工作負載,最新加速器搭配AMD ROCm開放軟體平台,兩強合併的組合為科學家與研究人員提供更為優越的高效能運算工作基礎。
瞄準Exascale等級時代所打造的開放軟體平台
AMD ROCm開發者軟體為exascale等級運算提供基礎。ROCm作為一個由編譯器、程式開發API與函式庫組成的開源工具集,可以幫助眾多exascale等級軟體開發者打造高效能應用程式。經過優化的ROCm 4.0能為基於MI100的系統提供大規模運算的效能。ROCm 4.0已將編譯器升級至支援開源並統一支援OpenMP® 5.0與HIP。此外,PyTorch與Tensorflow框架都已針對ROCm 4.0進行優化,能配合MI100達到更高的效能。ROCm 4.0是為高效能運算、機器學習以及人工智慧程式開發者量身打造的最新方案,讓他們開發高效能的可移植軟體。橡樹嶺國家實驗室領導運算中心科學總監Bronson Messer表示,我們已經率先使用MI100加速器,初步使用效果讓人非常振奮。我們見證到大幅的效能提升,相比其他GPU高出達2到3倍。我們也同樣意識到軟體對效能影響的重要性。開源的ROCm開放軟體平台以及HIP開發者工具能在各種平台上運行,這是我們自推出首款混合CPU/GPU系統以來最關切的特點。
AMD Instinct MI100加速器的關鍵功能與特色包括:
• 全新AMD CDNA架構-AMD CDNA架構提供卓越的效能與功耗效率,為AMD GPU提供exascale等級時代的效能,同時也是MI100加速器的核心。
• 為HPC工作負載提供領先的FP64與FP32效能-提供領先業界的11.5 TFLOPS尖峰FP64 效能,以及23.1 TFLOPS的尖峰FP32效能,幫助全球各地科學家與研究人員加快在生命科學、能源、金融、學術、政府、國防等領域的新發現。
• 為HPC與AI開發的全新Matrix Core技術-針對全範圍單精度與混合精度矩陣運算提供大幅提升效能,其中包括FP32、FP16、bFloat16、Int8、以及Int4等,促進HPC與AI的融合。
• 第2代AMD Infinity Fabric™技術-Instinct MI100使用3個AMD Infinity Fabric™ Link時,可在PCIe® 4.0上提供約2倍的P2P (peer-to-peer)尖峰I/O頻寬,以及每張顯示卡高達340 GB/s的總頻寬。在伺服器中,MI100 GPU可配備兩個完全連結的Quad GPU單元(hives),每個單元可為高速資料分享提供高達552 GB/s的P2P I/O頻寬。
• 超高速HBM2記憶體-配備32GB高頻寬HBM2記憶體以及1.2 GHz的時脈頻率,帶來超高的1.23 TB/s記憶體頻寬,支援龐大資料集,協助消弭資料在記憶體存取時的傳輸瓶頸。
• 支援業界最新PCIe® Gen 4.0技術-配合最新版PCIe Gen 4.0技術進行開發,在CPU與GPU之間提供高達64GB/s尖峰理論傳輸資料頻寬。
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- Synology參與secutech2026,展示最新一站式_AI影像監控解決方案
- 華擎科技榮獲2026亞太史蒂夫獎「卓越創新」及「最受歡迎企業」雙獎 創新治理與品牌價值深受國際青睞
- 技嘉與 NVIDIA 合作推出 GeForce RTX 50 系列與《PRAGMATA》遊戲套裝 提升沉浸遊戲體驗
- 台北轉型全球創新戰略核心 COMPUTEX × InnoVEX 打造城市級全球科技舞台 從展館走向城市 打造具國際影響力的科技創新戰略平台
- NVIDIA 推出 RTX Remix 進階粒子視覺特效更新 《漫威爭鋒》GeForce 獎勵與 DLSS 遊戲更新同步登場
- Meta AI 商家助理於台灣開放測試!助品牌精準決策、社群行銷再升級! 廣告管理介面導入 AI 輔助 生成數據洞察報告、提供客製化策略
- AI 威脅與混合辦公夾擊企業防線,Jamf 擴大參與 Cybersec 2026 年資安大會 首度以資安品牌日與 Apple 體驗區回應行動資安新局
- 隨 AI 儲存需求加速成長,WD 樹立永續基礎架構新標準 FY2025 會計年度永續發展報告,揭示了業界的肯定、積極目標與突破性循環創新, 彰顯 WD 在 AI 驅動資料經濟中,引領打造永續且具成本效益的基礎架構
- 金士頓強化Design-In與工業級解決方案布局 全方位搶占市場領導地位
- Sandisk 於 NAB 2026 推出多款全新專業級記憶卡
- 不只為穿搭加分,LG Styler 從衣物狀態成就真正品味! 許光漢談維持衣物狀態的關鍵:細節,才是品味的開始
- 技嘉全新GAMING系列電源供應器 搭載獨家T-Guard守護頂級 GPU!
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
- JEDEC發布全新DDR5標準規範,從DDR5-4800起跳! 將加速導入下世代高效能電腦系統
- 不再是Toshiba品牌,全新Dynabook 2019 新品發布,透過運算與服務改變世界
- Mac 版 Office 2016 正式在台上市!
- microSD技術邁入第十年,SanDisk microSD記憶卡出貨量突破20億片
- 英特爾前進3D NAND,發表Intel SSD 600p、6000p、E 5420s、E 6000p、DC P3520、DC S3520固態硬碟!
