焦點

NVIDIA Blackwell Ultra 在全新 MLPerf Inference 基準測試中樹立新標竿 NVIDIA GB300 NVL72 機架規模系統在全新推理(reasoning)推論基準測試中,展現最高輸送量;同時 NVIDIA 平台持續保持著所有資料中心項目的「每 GPU 推論」紀錄。

文.圖/陳信榮 2025-09-11 19:01:26

推論效能至關重要,因為它會直接影響人工智慧(AI)工廠的經濟效益。AI 工廠基礎設施的輸送量越高,就能以高速產生更多詞元(token),進而提高營收、降低總擁有成本(TCO),並提升整體系統的生產力。

採用 NVIDIA Blackwell Ultra 架構的 NVIDIA GB300 NVL72 機架規模系統,在 NVIDIA GTC 大會首度亮相至今不到半年後,已在 MLPerf Inference v5.1 的全新推理(reasoning)推論基準上創下紀錄,與採用 NVIDIA Blackwell 架構的 GB200 NVL72 系統相比,DeepSeek-R1 推論的輸送量最高可達 1.4 倍。

Blackwell Ultra 建立在 Blackwell 架構的成功之上。Blackwell Ultra 架構提供與 Blackwell 相比1.5 倍的 NVFP4 AI 運算與 2 倍的 attention-layer 加速,且每顆 GPU 可配備最高 288GB 的 HBM3e 記憶體。

NVIDIA 平台也在 MLPerf Inference v5.1 套件新增的所有資料中心基準上創下效能紀錄,包含 DeepSeek-R1、Llama 3.1 405B Interactive、Llama 3.1 8B 與 Whisper,同時持續維持每顆 GPU 在每項 MLPerf 資料中心基準中的紀錄。

全端整合

全端共同設計在交出這些最新基準成績時扮演重要角色。Blackwell 與 Blackwell Ultra 導入對 NVFP4 資料格式的硬體加速。NVFP4 是 NVIDIA 設計的 4 位元浮點格式,相較於其他 FP4 格式提供更佳準確度,也可達到與較高精度格式相當的準確度。

NVIDIA TensorRT Model Optimizer 軟體將 DeepSeek-R1、Llama 3.1 405B、Llama 2 70B 與 Llama 3.1 8B 量化為 NVFP4。搭配開源的 NVIDIA TensorRT-LLM 程式庫,這項最佳化使 Blackwell 與 Blackwell Ultra 在提交成績時能在滿足嚴格準確度要求的同時提供更高效能。

大型語言模型的推論由兩種執行特性截然不同的工作負載組成。這包括用於處理使用者輸入以產生第一個輸出詞元的情境(context),以及用於產生其後的所有輸出詞元的生成(generation)。

一種稱為「分離式服務(disaggregated serving)」的技術,會將情境與生成任務拆分,使每一部分都能獨立最佳化以達到最佳整體輸送量。這項技術是 Llama 3.1 405B Interactive 基準創下紀錄的關鍵之一。相較於在 NVIDIA DGX B200 伺服器上以傳統服務架構執行該基準時每顆 Blackwell GPU 的表現,GB200 NVL72 系統的每顆 GPU 效能提升將近 50%。

NVIDIA 也在本輪基準測試首度使用 NVIDIA Dynamo 推論框架提交成績。

NVIDIA 的合作夥伴,包括雲端服務供應商與伺服器製造商,提交了採用 NVIDIA Blackwell 與(或)Hopper 平台所展現的亮眼成績。這些夥伴包含 Azure、Broadcom、Cisco、CoreWeave、Dell Technologies、技鋼科技、HPE、Lambda、Lenovo、Nebius、Oracle、雲達科技、Supermicro 及 University of Florida。

在 NVIDIA AI 平台上領先市場的推論效能,現已由主要雲端服務供應商與伺服器製造商提供。這為部署進階 AI 應用的組織帶來更低的總擁有成本與更高的投資報酬。

若想進一步了解這些全端技術,請閱讀 NVIDIA 技術部落格關於 MLPerf Inference v5.1 的文章。也歡迎造訪 NVIDIA DGX Cloud Performance Explorer,以深入認識 NVIDIA 的效能與模型總擁有成本,並產生客製化報告。

→更多的【PCDIY!業界新聞】: 請見

→更多的【PCDIY!賣場情報】: 請見

→更多的【PCDIY!科技情報】: 請見

→更多的【IT資訊新聞】: 請見

→更多的【ITMan!資訊經理人】: 請見

→更多的【PCDIY!八卦】: 請見

延伸閱讀

(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!












































發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。