焦點

7nm火力登場、AMD Radeon Instinct MI60、MI50、Vega 20 GPU率先首發,PCIe 4.0規格全面備戰!

文.圖/Johan 2018-11-07 19:19:28
AMD雖然「腳踏兩條船」(意指要開發CPU,又要開發GPU),但近期的表現已讓市場改觀,證明了一家小公司也可以CPU和GPU都同時搞好,且小公司的「大」躍進,搭配其堅強的研發實力,不僅突破勁敵的猛烈砲火,甚至還讓勁敵的筆電CPU裡面搭載自家的顯示核心(即Radeon Vega M系列)。由此看來,AMD是在玩真的!之前被笑說是簡報公司,現在7nm的GPU已經出來囉!直接左打i社、右打n社,現在你看看,在7nm的道路上,誰才簡報公司呢?

AMD CEO 蘇姿丰女士 發表世界第一張採用7nm製程GPU設計之繪圖加速卡:Radeon Instinct MI60


GPU也要7nm!Radeon Instinct MI60/MI50繪圖加速卡正式發表!

AMD於11/7正式揭露其採用7nm製程之Zen 2代架構的處理器產品,同時也一併發表採用7nm製程之下世代Vega晶片的Radeon Instinct MI60與MI50繪圖加速卡(Graphic Accelerator,這種卡跟一般遊戲卡/顯示卡的用途不太一樣,是主打工業級繪圖,以及雲端伺服器密集運算專用的加速卡)。這次AMD在PC處理器市場與繪圖加速卡市場方面,在製程算是取得領先的地位!接下來讓我們看看這次AMD發表全新Radeon Instinct MI60與MI50繪圖卡(採用Vega 7nm繪圖晶片),有什麼特點與優勢!

呵呵!AMD率先推出7nm GPU囉!擁有高達2倍的密度、效能提升1.25倍以上,且在相同時脈下功耗比14nm少一半!所以是很強的GPU喔!


這麼強的GPU,當然要先針對雲端市場來設計啊(錢賺得比較多嘛!你看老黃也這樣…)!這次的GPU是HPC(高效能運算)的絕佳引擎!擁有各種彈性且可混合使用的精密度模式,提供絕佳效能,此外也有領導級頻寬與互連技術


以下先簡單看一下AMD官方的Radeon Instinct MI60介紹影片,以及產品發展藍圖吧!

AMD官方的Radeon Instinct MI60介紹影片

▼表 AMD的Radeon Instinct產品線發展藍圖

這個就是Vega 20 GPU,中間是GPU Die,兩邊共4個Die則是HBM2記憶體


Vega 20的GPU內部架構


這次的Vega 20 GPU,採用台機電7奈米FinFET製程,內部共有132.3億個電晶體,Die的大小為331mm2,可說是非常密集的設計。正由於採用7nm設計,AMD也在其Vega 20的GCN核心內做了一些強化,像是加入FP64這種運算模式,以及支援PCIe 4.0 x16介面,再搭配直接使用HBM2記憶體設計,使這顆Vega 20跟上一代的Vega 10相比,能以更少的用電(降低50%),並擁有更高的時脈(提升30%),讓顯示卡的效能提升!

Radeon Instinct MI60/MI50繪圖加速卡功能介紹

再來看繪圖加速卡的部份,這次AMD Radeon Instinct MI60,主打的應用括及預測(決策與判斷)、訓練(深度/機械學習/AI運算)、視覺化(各種視覺辨識)、高效能運算(各種需要密集運算的工作)等領域使用。透過Vega 20的7nm加持,其時脈拉高到1.8GHz,搭配32GB的500MHz HBM2記憶體,以及4096位元的記憶體頻寬,搭配PCIe 4.0 x16介面設計,提供了高達1TB/s的記憶體頻寬,在算力方面也提升不少,包含FP16/FP32都有20%以上的效能提升,而全新的FP64則比上一代產品快了高達9.64倍的效能提升!因此在進行更高倍精密度的運算時,Radeon Instinct MI60能賦予更高的運算品質與更快的執行效能!

除了浮點運算外,傳統整數運算當然也支援,且效能非常卓越。在INT4的效能達到118 TOPs,而INT8可以達到59 TOPs。

Radeon Instinct MI60繪圖加速卡!


Radeon Instinct MI60繪圖加速卡的官方拆解圖


▼表 AMD的Radeon Instinct MI60與MI50的規格比較

以下就是以Vega 20所設計出來的Radeon Instinct MI60與MI50的特點:

● 針對深度學習指令優化:提供靈活的混合精度模式,像是FP16、FP32和INT4、INT8等等,以滿足各種變動的工作負載以及工作量不斷增長的需求,以便訓練複雜的神經網路,或針對受過訓練的網路來進行各種推理實驗。

● 世界最快雙精度PCIe運算加速器:AMD Radeon Instinct MI60目前已經算是打破紀錄成為世界上最快的雙精度加速器,提供高達7.4 TFLOPs的FP64運算效能,讓科學家和研究人員能夠更有效地處理跟生命科學相關的各種行業之HPC應用,包括能源、金融、汽車、航太、學術、政府、國防等領域。至於AMD Radeon Instinct MI50則可提供高達6.7 TFLOPS的FP64運算效能,能為各種深度學習的工作負載提供高效又經濟的解決方案,同時也能在VDI(虛擬桌面基礎架構)、DaaS (桌面即服務)、雲端環境中,提升反覆使用率。

● 高達6倍的資料傳輸速度:兩顆GPU可透過Infinity Fabric連接起來可提供高達200GB/s的點對點頻寬,比單獨使用PCIe 3.0的頻寬還快6倍。

Radeon Instinct MI60繪圖加速卡搭配EPYC (Rome)的互連技術示意圖


這樣一次連4張!用起來一定很爽吧!


● 採用超快速的HBM2記憶體:AMD Radeon Instinct MI60與MI50分別提供32GB與16GB的HBM2 ECC記憶體。GPU本身具備全晶片ECC以及RAS(可靠性、可存取性、可維護性)能力,這些技術對於一些大規模HPC部署時,能提供更準確的計算結果。

● 更安全的虛擬化工作負載支援:AMD MxGPU技術是業界唯一基於硬體的GPU虛擬化解決方案,基於SR-IOV (單根I/O虛擬化)的產業標準技術,讓駭客難以攻擊並滲透到硬體等級,如此將有助於為虛擬化雲部署提供絕佳的安全性。

效能與Tesla相當!11/18上市

這次Radeon Instinct MI60/MI50,可支援OpenGL 4.6、OpenCL 2.0、Vulkan 1.0,以及ROCm (Radeon Open eCosystem)等軟體API支援,並提供Linux專用驅動程式,讓有雲端密集運算需求的應用得以加速運算完成。在官方公布的效能測試數據中,可發現某些測試條件下,MI60比Tesla V100還快一些些,有些則是慢一點點,但慢不到6%。因此可說是旗鼓相當!

AMD這次以7nm,來回應對手的RTX,雖然有點是香蕉比蘋果的作法。但若以站在同樣是雲端或AI運算應用來說,AMD可說是趕上來了!透過7nm、HBM2,以及Infinity Fabric的加持,讓其Radeon Instinct MI60的效能,可以與NVIDIA的Tesla V100達到相同等級的表現!目前MI60和MI50都預計在北美時間2018/11/18正式發售!

效能比一比,透過DGEMM和SGEMM測試,可發現MI60比Tesla V100還快一些些


至於RESNET-50訓練部份,AMD也很誠實,說明MI60效能大概跟Tesla V100能夠追上,只差7%而已


下世代的Radeon Instinct?

這代產品都還沒正式上市,連下一代產品都先預告給你知道的,看來目前應該只有AMD敢這麼做了!這次發表了Radeon Instinct MI60,是首款7nm GPU、首款PCIe 4.0的GPU,那麼下一代呢?AMD也想好了,就先叫做MI-NEXT吧!預計明年(2019年)推出,擁有更高效能、更多的連接性、更好的軟體支援!就讓我們密切期待吧!

MI60之後,還有下一代產品,暫時叫做MI-NEXT。


這就是AMD Radeon Instinct MI60的總結:首款7nm GPU、首款PCIe 4.0 GPU搭配Infinity Fabric互連技術、有效記憶體頻寬達1TB/s、世界唯一硬體虛擬化GPU、HPC應用下FP64效能達7.4 TFLOPS、訓練應用下FP32達14.7 TFLOPS、預測應用下INT4更可高達118 TOPS!


延伸閱讀

(01) CPU核戰開打、AMD最強Zen 2架構7nm EPYC Rome內建64C/128T核心,入主伺服器龍頭寶座王位
(02) 7nm火力登場、AMD Radeon Instinct MI60、MI50、Vega 20 GPU率先首發,PCIe 4.0規格全面備戰! (本篇)


發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。

最近新增