焦點

NVIDIA Vera Rubin 開啟代理型 AI 新前沿 七款全新晶片全面量產,助力打造全球規模最大的 AI 工廠,其可配置的 AI 基礎架構 針對 AI 各階段進行最佳化,從預訓練、後訓練與測試階段擴展到代理型推論皆涵蓋其中

文.圖/張國華 2026-03-17 13:40:06

NVIDIA Vera Rubin 平台正開啟 AI 的下一個前沿,包含:
● Vera Rubin NVL72 GPU 機架
● Vera CPU 機架
● NVIDIA Groq 3 LPX 推論加速器機架
● NVIDIA BlueField-4 STX 儲存機架
●NVIDIA Spectrum-6 SPX 乙太網路機架

【2026年3月16日,美國聖荷西訊】NVIDIA 今日宣布,NVIDIA Vera Rubin 平台正開啟代理型人工智慧(AI)發展的下一個前沿,目前七款新晶片已全面進入量產,以擴展全球規模最大的 AI 工廠。

該平台整合 NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6 交換器、NVIDIA ConnectX®-9 SuperNIC、NVIDIA BlueField®-4 DPU 與 NVIDIA Spectrum™-6 乙太網路交換器,以及全新整合的 NVIDIA Groq 3 LPU。這些晶片目標透過協同運作來組成一台強大的 AI 超級電腦,驅動 AI 的各個階段,從大規模預訓練、後訓練、測試階段擴展,到即時的代理型推論皆涵蓋其中。

NVIDIA 創辦人暨執行長黃仁勳表示:「Vera Rubin 代表跨世代的躍進,七款突破性晶片、五組機架、一台巨型超級電腦,旨在驅動 AI 的每一個階段。代理型 AI 的關鍵轉捩點已然來臨,且由 Vera Rubin 為史上最大規模的 AI 基礎設施建設拉開序幕。」

Anthropic 執行長暨共同創辦人 Dario Amodei 表示:「企業與開發者正將 Claude 應用於日益複雜的推理、代理型工作流程及關鍵任務決策,而這需要能夠與時俱進的基礎設施。NVIDIA 的 Vera Rubin 平台為我們提供了所需的運算、網路及系統設計,讓我們在持續提供服務的同時,也能提升客戶所仰賴的安全性與可靠性。」

OpenAI 執行長 Sam Altman 表示:「NVIDIA 的基礎設施是我們持續推進 AI 前沿的重要基礎。有了 NVIDIA Vera Rubin,我們將能大規模運行更加強大的模型與代理,並為數億用戶提供更快速且更可靠的系統。」

邁向 POD 級系統

AI 基礎設施正迅速演進,從獨立晶片與單一伺服器,發展到完全整合的機架級系統、POD 級部署、AI 工廠與主權 AI。這些進展正帶來顯著的效能提升,為各產業、各規模的組織,從新創公司和中型企業,到公私合作機構與大型企業,帶來更高的成本效益。這也同時有助於普及 AI 技術,並提升能效,以驅動全球最具挑戰性的工作負載。

透過運算、網路和儲存的深度協同設計,並在擁有全球供應鏈的 80 多家 NVIDIA MGX 生態系合作夥伴的支持下,NVIDIA Vera Rubin 提供了最全面的 NVIDIA POD 級平台,這是一台超級電腦,其中多個專為 AI 打造的機架協同運作,形成一個龐大且一致的系統。

NVIDIA Vera Rubin NVL72 機架

Vera Rubin NVL72 整合 72 顆 Rubin GPU 與 36 顆 Vera CPU,透過 NVLink 6 進行互連,並搭配 ConnectX-9 SuperNIC 與 BlueField-4 DPU,帶來突破性的運算效率。該系統在訓練大型混合專家模型時,所需 GPU 數量僅為NVIDIA Blackwell 平台的四分之一,且每瓦的推論資料輸送量最高可提升 10 倍,每個詞元成本僅為先前的十分之一。

NVL72 專為全球超大規模 AI 工廠打造,可透過 NVIDIA Quantum-X800 InfiniBand 與 Spectrum-X 乙太網路無縫擴展,在大型 GPU 叢集上維持高利用率,同時降低訓練時間與總擁有成本(TCO)。

NVIDIA Vera CPU 機架

強化學習與代理型 AI 工作負載需要大量基於 CPU 的環境,以測試並驗證在 GPU 系統上運行的模型所產生的結果。

NVIDIA Vera CPU 機架提供高密度液冷基礎設施,採用 NVIDIA MGX 架構並整合最多 256 顆 Vera CPU,提供可擴展且節能的運算能力,並具備世界級的單執行緒效能,從而實現大規模的代理型 AI。

Vera CPU 機架與 Spectrum-X 乙太網路整合,可在整個 AI 工廠內保持 CPU 環境同步。與 GPU 運算機架搭配後,可為大規模代理型 AI 與強化學習提供 CPU 運算基礎。其中 Vera 的運算效率是傳統 CPU 的兩倍,速度則提升 50%。

NVIDIA Groq 3 LPX 機架

NVIDIA Groq 3 LPX 標誌著加速運算的重要里程碑。專為代理型系統的低延遲和大型情境需求所設計,LPX與 Vera Rubin 結合了兩款處理器的極致效能,使兆級參數模型每兆瓦的推論資料輸送量最高可提升 35 倍,同時創造出多達 10 倍的營收機會。

在大規模部署下,一組 LPU 叢集可作為巨型的單一處理器運作,實現快速且可預測的推論加速。LPX 配備 256 顆 LPU 處理器,並擁有 128GB 晶片內 SRAM 及 640 TB/s 的擴展頻寬。當與 Vera Rubin NVL72 系統搭配部署時,Rubin GPU 與 LPU 會針對每個輸出詞元,共同運算 AI 模型的每一層,從而提升解碼(decode)效能。

針對兆級參數模型和百萬詞元的情境進行最佳化的 LPX 協同設計架構與 Vera Rubin 進行搭配,可在功耗、記憶體及運算方面實現極致效率。更高的每瓦資料輸送量和更優異的詞元效能,開啟了全新層級的超高端、兆級參數與百萬級情境推論,為所有 AI 供應商拓展營收機會。LPX 採全液冷設計,並建立於 MGX 基礎架構之上,可無縫整合至新一代 Vera Rubin AI 工廠中,預計將於今年下半年推出。

NVIDIA BlueField-4 STX 儲存機架

NVIDIA BlueField-4 STX 機架級系統是一套 AI 原生的儲存架構,可將 GPU 記憶體無縫延伸至整個 POD。由整合 NVIDIA Vera CPU 與 NVIDIA ConnectX-9 SuperNIC 的 BlueField-4 驅動,STX 提供高頻寬的共享儲存層,針對大型語言模型(LLM)與代理型 AI 工作流程產生的大量 KV 快取資料,進行最佳化的儲存與讀取。

NVIDIA DOCA Memos™ 是全新的 DOCA 框架,可大幅強化 BlueField-4 儲存的能力,並支援專用的 KV 快取儲存處理。與通用儲存架構相比,可將推論時的資料輸送量提升高達 5 倍,同時顯著提高能源效率。其成果在於實現整個 POD 層級的情境共享能力,不僅能加速 AI 代理的多輪互動,亦可擴展 AI 服務規模,並提升整體基礎設施的利用率。

Mistral AI 共同創辦人暨技術長 Timothée Lacroix 表示:「NVIDIA BlueField-4 STX 機架級情境記憶體儲存系統將帶來關鍵的效能提升,這對於我們大規模擴展代理型 AI 成果至關重要。透過提供專為 AI 代理記憶體打造的全新儲存層級,STX 具備絕佳優勢,能確保我們的模型在對大量資料集進行推理時,仍能維持一致性與速度。」

NVIDIA Spectrum-6 SPX 乙太網路機架
Spectrum-6 SPX 乙太網路機架專為加速 AI 工廠的東西向流量而設計,可搭配 Spectrum-X 乙太網路或 NVIDIA Quantum-X800 InfiniBand 交換器,並大規模提供低延遲且高輸送量的機架間連線能力。

採用共同封裝光學元件的 Spectrum-X 乙太網路光子技術,相較於傳統可插拔式收發器,在光學方面的能效提高 5 倍,韌性也同步提升 10 倍。

提升韌性與能源效率

NVIDIA 與超過 200 家資料中心基礎設施合作夥伴共同宣布推出適用於 Vera Rubin 的 NVIDIA DSX 平台。該平台包含 DSX Max-Q,可實現整個 AI 工廠的動態供電配置,使固定功率的資料中心能部署多出 30% 的 AI 基礎設施。全新的 DSX Flex 軟體讓 AI 工廠成為具備電網彈性的資產,釋放出 100 百萬瓩的閒置電網電力。

NVIDIA 亦同步發表 Vera Rubin DSX AI 工廠參考設計,這是一套專為協同設計 AI 基礎設施打造的藍圖,以最大化每瓦的詞元產出與整體有效輸送量,同時提升系統韌性並加速 AI 系統導入生產環境。

透過緊密整合運算、網路、儲存、電力與散熱系統,該架構可提升能效,確保 AI 工廠在持續的高強度工作負載下,仍能穩定擴展並維持最大化的正常運行時間。

生態系全面支援

基於 Vera Rubin 平台的產品將於今年下半年開始由合作夥伴推出,包括主要雲端服務供應商 Amazon Web Services、Google Cloud、Microsoft Azure 與 Oracle Cloud Infrastructure,以及 NVIDIA 雲端合作夥伴 CoreWeave、Crusoe、Lambda、Nebius、Nscale 與 Together AI.。

全球系統製造商思科、戴爾科技集團、慧與科技、聯想集團與美超微預計將推出多款採用 Vera Rubin 平台的伺服器產品。此外,Aivres、華碩、鴻海科技集團、技嘉科技、英業達、和碩聯合科技、雲達科技、緯創和緯穎等廠商也將提供相關系統。

AI 實驗室與尖端模型開發者,包括 Anthropic、Meta、Mistral AI 與 OpenAI,也正計畫利用 NVIDIA Vera Rubin 平台訓練規模更大且能力更強大的模型,並以相較前幾代 GPU 更低的延遲和成本,支援長情境與多模態系統。

→更多的【PCDIY!業界新聞】: 請見

→更多的【PCDIY!賣場情報】: 請見

→更多的【PCDIY!科技情報】: 請見

→更多的【IT資訊新聞】: 請見

→更多的【ITMan!資訊經理人】: 請見

→更多的【PCDIY!八卦】: 請見

延伸閱讀

(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰![http://www.pcdiy.com.tw/detail/5232]
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!












































發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。

最近新增