ITMan!資訊經理人
擴展到新高度:NVIDIA MLPerf 訓練結果展示了前所未有的效能和彈性 NVIDIA 在最新的 MLPerf 訓練基準測試中達到了無與倫比的效能和近 100% 的擴充效率
文.圖/陳一飛 2024-06-13 10:58:18全端NVIDIA加速運算平台在最新的MLPerf Training v4.0基準測試中再次展現出卓越的效能。
與去年 NVIDIA 提交創新紀錄的數據相比,NVIDIA 在基於 GPT-3 175B 的大型語言模型(LLM)基準測試中的表現,提升了三倍以上。 NVIDIA 使用配備11,616 個NVIDIA H100 Tensor Core GPU 並與NVIDIA Quantum-2 InfiniBand 網路連接的人工智慧(AI)超級電腦,透過更大規模(比一年前提交的3,584 個H100 GPU 增加三倍多)和廣泛的全端工程實現了這項非凡壯舉。
由於 NVIDIA AI 平台的可擴展性,Eos 現在可以更快地訓練 GPT-3 175B 等大規模 AI 模型,這種出色的 AI 效能可以轉化為巨大的商機。例如,在NVIDIA最近的財報電話會議中,我們描述了大型語言模型服務供應商如何在 NVIDIA HGX H200 伺服器上運行 Llama 3 70B 模型,在短短四年內將一美元投資轉化為七美元。這個投資回報是假設一家大型語言服務供應商使用吞吐量為每秒 24,000詞元的HGX H200伺服器,以每百萬詞元0.6美元的價格提供 Llama 3 70B 服務。
NVIDIA H200 GPU 增強生成式 AI 和 HPC
NVIDIA H200 Tensor GPU 基於 Hopper 架構的優勢而構建,擁有 141GB HBM3 記憶體,與 H100 GPU 相比,記憶體頻寬增加了 40% 以上。 NVIDIA H200 Tensor Core GPU 突破了 AI 訓練的極限,在其首次亮相的 MLPerf Training 中延伸 H100 的效能並提高了 47%。軟體帶來無與倫比的效能提升
此外,由於對 NVIDIA 軟體堆疊進行了大量最佳化,我們使用 512 個H100 GPU 的配置所提交的結果現在比一年前快了 27%。這項改進凸顯了即使使用相同的硬體,持續的軟體增強也可以顯著提高效能。
這項工作也實現了近乎完美的擴充。隨著 GPU 數量從去年的 3,584 個 H100 GPU 增加到此次提交的 11,616 個 H100 GPU,增加 3.2 倍,提交的效能也隨之等比增加。
歡迎至NVIDIA 技術部落格上了解這些最佳化的相關資訊。
在大型語言模型(LLM)微調方面的卓越表現
隨著企業尋求客製化預訓練的大型語言模型,大型語言模型微調正在成為產業關鍵的工作負載。 本輪MLPerf引入基於應用於 Meta Llama 2 70B 的熱門低秩適應(LoRA)技術的全新大型語言模型微調基準。NVIDIA 平台在這項任務中表現出色,從 8 個GPU擴展到 1,024 個GPU,NVIDIA提交了在最大規模的運算結果創紀錄的 1.5 分鐘內完成了基準測試
加速Stable Diffusion和 GNN 訓練
NVIDIA 也在上一輪提交的相同系統規模下將 Stable Diffusion v2 訓練效能提高了 80%。這些進步反映了 NVIDIA 軟體堆疊的諸多強化,展示了軟體和硬體改進如何並進以提供頂級效能。
在基於 R-GAT 的新圖神經網路(GNN)測試中,配備 H100 GPU 的 NVIDIA 平台在小規模和大規模方面均表現出色。與 H100 相比,H200 在單節點 GNN 訓練方面提升了 47%。這展示了 NVIDIA GPU 的強大效能和高效率,使其成為各種 AI 應用的理想選擇。
廣泛的生態系支持
10家NVIDIA合作夥伴提交了結果,反映了NVIDIA AI生態系的廣度,包括華碩、戴爾科技集團、富士通、技嘉科技、慧與企業、聯想、甲骨文、雲達科技、美超微和Sustainable Metal Cloud。此廣泛的參與以及各夥伴傑出的基準測試結果,突顯了 NVIDIA AI 平台在整個產業的廣泛採用和信任。MLCommons持續致力於將基準測試最佳實踐引入AI運算至關重要。透過對 AI 和 HPC 平台進行同儕審查比較,並跟上 AI 運算的快速變化,MLCommons 為世界各地的公司提供了有助於引導重要採購決策的關鍵數據。
隨著 NVIDIA Blackwell平台推出,用於訓練和推論的兆參數生成式 AI 模型的新一等級AI 效能即將實現。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!

- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- PCDIY!第十九屆玩家票選品牌大賞暨ITMan!企業品牌大調查2024,票選結果暨得獎公布!
- DEVCORE 蟬聯 IT Matters Awards 最佳 IT 雇主獎! 實施週休三日、系統性培育資安人才雙管齊下
- 防颱需求激增!PChome 24h購物泡麵、零食/餅乾銷量飆升逾100% 備戰山陀兒颱風!PChome 24h購物「 颱風快報專區」必買物資一站備齊
- MSI微星科技參展台灣國際智慧能源週 全方位充電解決方案助力電動車產業發展
- 視博通嚴選「先馬 SAMA MG-I/MG-II 機殼+九州風神 DeepCool OK550D 550W電源供應器」超值「C+P套餐」, 免費「九州風神 DeepCool AG400空冷散熱器」送給你!
- Cherry 10月萬聖節狂歡大促!櫻桃粉絲不可錯過的驚喜優惠
- 凱擘大寬頻暖秋超Chill限時方案 現省5千元再抽上萬元英倫藍牙喇叭
- Instagram 陪大家玩音樂、展現品味 迎接國際音樂日! 個人檔案加音樂展現自我、限時動態播黑膠唱片吹復古風
- 十銓科技推出T-FORCE DELTAα RGB DDR5 桌上型記憶體 完美匹配AMD 新平台 極致超頻潛力銓面釋放
- Galaxy AI極智星寵!Galaxy Tab S10系列旗艦平板正式登台
- LG分享「AI webOS」生態系統擴展策略與未來藍圖 LG透過「AI webOS」智慧平台推動策略性成長 創造卓越顧客價值與獨特用戶體驗
- VOLVO 以可循環建材打造佔地百坪永續迷宮 吸睛地標限時落腳嘉義 「循常好日子」永續生活節 號召千名車主發電近千瓦響應循環永續
最多人點閱
- SUPERMICRO SUPERO M12SWA-TF伺服器主機板實測開箱,史上最強實戰AMD Ryzen Threadripper Pro 3995WX為究極效能而生!
- 專訪夢想動畫公司!配置高效能GIGABYTE Server,以技嘉伺服器建構首屈一指的AI運算與遠端桌面動畫應用!
- D-Link DXS-1210-10TS網管型10GbE交換器實測開箱,10Gbps超高速網路環境不是夢!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- 超車Intel最強Xeon Platinum 8380處理器2.8倍性能!AMD第四代EPYC 9004系列正式登場,引進12通道DDR5-4800記憶體、PCIe 5.0、CXL記憶體與最高96核心192執行緒戰鬥力,霄龍EPYC 9654榮登伺服器處理器世界之王!
- GIGABYTE Server MZ32-AR0 Server主機板實測開箱,體驗AMD EPYC 7742處理器的強大戰鬥力!
- GIGABYTE Server MW51-HP0工作站主機板實測開箱,打造完美遊戲多開、多虛擬機、影音轉檔超順暢超強電腦!
- GIGABYTE Server MW51-HP0工作站主機板實測開箱,Intel W2100/2200高效能工作站重裝上陣!
- HPE Aruba Instant On 1930 8G Class4 PoE 2SFP 124W(JL681A)交換器實測開箱,中小企業智慧託管網路的神兵利器!
- GIGABYTE Server W291-Z00工作站實測開箱,史上最強AMD EPYC 7001系列處理器運算神器!
- Western Digital Gold 18TB金標硬碟實測開箱,企業級機械硬碟中的優質精品!
- GIGABYTE Server E152-ZE0實測開箱,史上最強AMD EPYC 7002/7003系列1U伺服器完全解密!