PCDIY!業界新聞
軟體定義、硬體加速的可程式設計 InfiniBand NDR 網路,助力 Exascale 等級的人工智慧和高效能運算平台
(本資訊由廠商提供,不代表PCDIY!立場) 2020-12-17 18:24:25
NVIDIA (輝達) 於 SC20 大會上,宣布推出 NVIDIA® Mellanox® 400G InfiniBand,這是全球首個 400Gb/s 網速的端到端網路解決方案,可為全球的人工智慧 (AI) 和高效能運算用戶提供最快的網路互連效能,同時成功將運算、可程式化和軟體定義三種技術結合,成為業界領先的軟體定義、硬體加速的可程式設計網路,為全球的研究人員和工程人員設計新一代運算系統,並針對應用效能的提升提供了新的思維。
NVIDIA Mellanox InfiniBand NDR 產品是第 7 代的 InfiniBand 產品,利用 100Gb/s的 PAM4 Serdes 技術,實現了較前一代產品兩倍提升的 400Gb/s 單埠傳輸頻寬,同時透過增加更多、更快的加速引擎,實現了更強大的運算和通訊能力。
「Speed of Light」是關於 NDR InfiniBand 技術的第一個特徵,透過加倍的頻寬、更快的訊息率 (Message Rate),讓基於 RDMA、GPU Direct RDMA 和 GPU Direct Storage 等先進通訊技術的應用效能得到了進一步的提升。InfiniBand 網路是自然的 SDN 網路,可以讓使用者根據應用的屬性來選擇各種不同的網路拓撲,以達到最優化的效能,如 Fat-Tree、DragonFly+、各種 Torus 等。例如,透過 DragonFly+網路拓撲可以同時在四個交換器 Hop 內達到一百萬個節點間的同時通訊,這個規模遠遠超出了 E級超算 、甚至 10 E 級超算或百 E 級超算需要的規模;同時其自然的 SDN 屬性也讓動態路由和網路壅塞控制變得更容易。InfiniBand 動態路由已被廣泛地應用到各種網路拓撲中,成為優化通訊效能的關鍵角色,如美國橡樹嶺國家實驗室的 Summit 超級電腦就透過動態路由將超級電腦中心全網的通訊效率從 60% 提升到了 96%。NDR InfiniBand 交換器在 1U 空間內可以支援 64 個 400Gb/s 的埠或 128 個 200Gb/s 的埠,提供較上一代交換器 3 倍的埠密度;它還將交換器系統的聚合雙向吞吐量提高了 5 倍,達到每秒 1.64 petabits,是全球埠數最多、交換容量最大的交換器。
硬體加速是 InfiniBand 網路的最大特色,隨著越來越多的加速引擎被添加到
InfiniBand 硬體中,進一步加大了其相對於其它網路技術的領先性。舉例來說,NDR InfiniBand 實現了對業界而言最困難的 All2All 和 Allreduce 通訊的硬體卸載,能讓訊息傳遞介面 (MPI) 通訊的效能提升四倍;NDR InfiniBand 對於 MPI Tag Matching 的硬體卸載實現了 1. 8 倍的 MPI 通訊效能提升;NDR InfiniBand 可以實現對於 NVMeoF 的全面卸載,NVMeoF 的 Target 卸載可以讓儲存系統在幾乎不消耗 Target 端 CPU 的前提下,達到數百萬級的 IOPS;NVME SNAP 可以實現對於 NVMeoF 的 Initiator 端的卸載,同時可以將 InfiniBand 網路模擬成 NVMe 磁碟提供給主機 CPU,解決目前很多 OS 還沒有 NVMeoF 的 Initiator 支援問題,實現了對任何 OS,無論是虛擬化還是實體機的全面 NVMeoF 的支持;InfiniBand FIO SNAP 可以實現對於文檔儲存的本地模擬,讓任何 OS 都可以享受最先進的分散式文檔儲存系統的效能優勢。
InfiniBand SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) 技術徹底消除 MPI 或 NCCL (NVIDIA Collective Communications Library) 的 Allreduce 操作中的多打一通訊帶來的 Incast Burst 問題,在保證所有埠全線速、共計 12.8Tb/s 或 25.6Tb/s 的資料登錄的前提下,實現在交換器上的 Allreduce、Barrier、Reduce 和 Broadcast 運算,在 NDR 交換器上較前一代交換器提升 32 倍的運算效能。InfiniBand SHIELD (Self-Healing Interconnect Enhancement for Intelligent Datacenters) 技術實現了網路中鏈路故障的自修復,讓網路無需等待管理軟體的參與來恢復鏈路故障,較傳統的軟體故障恢復速度快千倍以上的效能,讓應用不再受困鏈路故障的干擾以提升應用的效能。
InfiniBand 安全卸載是針對 Cloud Native 的應用場景,InfiniBand 已取得 Open Stack 的官方軟體支援,透過自帶的硬體 IPSec、TLS、AES、Root of Trust 等功能,讓資料不論是在網路中移動時,還是在向儲存中落盤時都能以線速效能取得並解密,實現在虛擬化環境或容器化環境中的安全保障。
軟體可程式設計讓 InfiniBand 的應用場景得到了進一步的延伸,可程式化的 NDR InfiniBand 不僅可以讓使用者處理資料的標頭 (header),還可以針對資料的路徑進行操作,例如使用者可以自訂規則並對資料路徑進行操作,或是讓資料無需送到 CPU 便可直接在網路中進行預處理。使用者還可以針對資料的通訊特徵進行提取,接著利用 AI 技術進行訓練,得到不同應用資料的通用通訊特徵,若發現有異常通訊資訊,則可以向管理員主動發出預警。
NDR InfiniBand 以其優異的效能和靈活廣泛的使用場景吸引了許多合作夥伴共同打造生態系,包含 Atos、戴爾科技 (Dell Technologies)、富士通 (Fujitsu)、浪潮、聯想 (Lenovo) 和美超微 (Supermicro) 等基礎架構製造商,以及 DataDirect Networks (DDN) 與 IBM Storage 等儲存基礎架構商。各家公司都已開始研發其新一代產品,並展現對 NDR InfiniBand 的支持。而包括微軟 Azure 公有雲、美國 Los Alamos 國家實驗室、歐洲 Jülich 超級電腦中心等引領業界的用戶都紛紛表示,期待能盡快採用 NDR InfiniBand 以享受 NDR 的技術優勢。
NVIDIA 網路事業部門資深副總裁 Gilad Shainer 表示:「對我們的人工智慧客戶而言,最重要的工作是應對越來越複雜的應用,它們都需要更快、更聰明且更具擴充性的網路。NVIDIA Mellanox 400G InfiniBand 的巨大吞吐量與智慧加速引擎,讓高效能運算、人工智慧與超大規模雲端基礎架構可以透過更低的成本與複雜性,達成無與倫比的效能。」
Exascale 等級的 AI 和高效能運算時代已經來臨,同時也帶來新的挑戰。由軟體定義、硬體加速、針對網路運算的可程式設計 NDR InfiniBand 產品將於 2021 年第二季推出樣本。NDR 產品的出現,將會大幅提升 Exascale 等級的 AI 和高效能運算系統的效能和效率,並簡化系統的管理和操作、降低系統的總擁有成本 (TCO),進而保護資料中心的投資。
NVIDIA Mellanox InfiniBand NDR 產品是第 7 代的 InfiniBand 產品,利用 100Gb/s的 PAM4 Serdes 技術,實現了較前一代產品兩倍提升的 400Gb/s 單埠傳輸頻寬,同時透過增加更多、更快的加速引擎,實現了更強大的運算和通訊能力。
「Speed of Light」是關於 NDR InfiniBand 技術的第一個特徵,透過加倍的頻寬、更快的訊息率 (Message Rate),讓基於 RDMA、GPU Direct RDMA 和 GPU Direct Storage 等先進通訊技術的應用效能得到了進一步的提升。InfiniBand 網路是自然的 SDN 網路,可以讓使用者根據應用的屬性來選擇各種不同的網路拓撲,以達到最優化的效能,如 Fat-Tree、DragonFly+、各種 Torus 等。例如,透過 DragonFly+網路拓撲可以同時在四個交換器 Hop 內達到一百萬個節點間的同時通訊,這個規模遠遠超出了 E級超算 、甚至 10 E 級超算或百 E 級超算需要的規模;同時其自然的 SDN 屬性也讓動態路由和網路壅塞控制變得更容易。InfiniBand 動態路由已被廣泛地應用到各種網路拓撲中,成為優化通訊效能的關鍵角色,如美國橡樹嶺國家實驗室的 Summit 超級電腦就透過動態路由將超級電腦中心全網的通訊效率從 60% 提升到了 96%。NDR InfiniBand 交換器在 1U 空間內可以支援 64 個 400Gb/s 的埠或 128 個 200Gb/s 的埠,提供較上一代交換器 3 倍的埠密度;它還將交換器系統的聚合雙向吞吐量提高了 5 倍,達到每秒 1.64 petabits,是全球埠數最多、交換容量最大的交換器。
硬體加速是 InfiniBand 網路的最大特色,隨著越來越多的加速引擎被添加到
InfiniBand 硬體中,進一步加大了其相對於其它網路技術的領先性。舉例來說,NDR InfiniBand 實現了對業界而言最困難的 All2All 和 Allreduce 通訊的硬體卸載,能讓訊息傳遞介面 (MPI) 通訊的效能提升四倍;NDR InfiniBand 對於 MPI Tag Matching 的硬體卸載實現了 1. 8 倍的 MPI 通訊效能提升;NDR InfiniBand 可以實現對於 NVMeoF 的全面卸載,NVMeoF 的 Target 卸載可以讓儲存系統在幾乎不消耗 Target 端 CPU 的前提下,達到數百萬級的 IOPS;NVME SNAP 可以實現對於 NVMeoF 的 Initiator 端的卸載,同時可以將 InfiniBand 網路模擬成 NVMe 磁碟提供給主機 CPU,解決目前很多 OS 還沒有 NVMeoF 的 Initiator 支援問題,實現了對任何 OS,無論是虛擬化還是實體機的全面 NVMeoF 的支持;InfiniBand FIO SNAP 可以實現對於文檔儲存的本地模擬,讓任何 OS 都可以享受最先進的分散式文檔儲存系統的效能優勢。
InfiniBand SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) 技術徹底消除 MPI 或 NCCL (NVIDIA Collective Communications Library) 的 Allreduce 操作中的多打一通訊帶來的 Incast Burst 問題,在保證所有埠全線速、共計 12.8Tb/s 或 25.6Tb/s 的資料登錄的前提下,實現在交換器上的 Allreduce、Barrier、Reduce 和 Broadcast 運算,在 NDR 交換器上較前一代交換器提升 32 倍的運算效能。InfiniBand SHIELD (Self-Healing Interconnect Enhancement for Intelligent Datacenters) 技術實現了網路中鏈路故障的自修復,讓網路無需等待管理軟體的參與來恢復鏈路故障,較傳統的軟體故障恢復速度快千倍以上的效能,讓應用不再受困鏈路故障的干擾以提升應用的效能。
InfiniBand 安全卸載是針對 Cloud Native 的應用場景,InfiniBand 已取得 Open Stack 的官方軟體支援,透過自帶的硬體 IPSec、TLS、AES、Root of Trust 等功能,讓資料不論是在網路中移動時,還是在向儲存中落盤時都能以線速效能取得並解密,實現在虛擬化環境或容器化環境中的安全保障。
軟體可程式設計讓 InfiniBand 的應用場景得到了進一步的延伸,可程式化的 NDR InfiniBand 不僅可以讓使用者處理資料的標頭 (header),還可以針對資料的路徑進行操作,例如使用者可以自訂規則並對資料路徑進行操作,或是讓資料無需送到 CPU 便可直接在網路中進行預處理。使用者還可以針對資料的通訊特徵進行提取,接著利用 AI 技術進行訓練,得到不同應用資料的通用通訊特徵,若發現有異常通訊資訊,則可以向管理員主動發出預警。
NDR InfiniBand 以其優異的效能和靈活廣泛的使用場景吸引了許多合作夥伴共同打造生態系,包含 Atos、戴爾科技 (Dell Technologies)、富士通 (Fujitsu)、浪潮、聯想 (Lenovo) 和美超微 (Supermicro) 等基礎架構製造商,以及 DataDirect Networks (DDN) 與 IBM Storage 等儲存基礎架構商。各家公司都已開始研發其新一代產品,並展現對 NDR InfiniBand 的支持。而包括微軟 Azure 公有雲、美國 Los Alamos 國家實驗室、歐洲 Jülich 超級電腦中心等引領業界的用戶都紛紛表示,期待能盡快採用 NDR InfiniBand 以享受 NDR 的技術優勢。
NVIDIA 網路事業部門資深副總裁 Gilad Shainer 表示:「對我們的人工智慧客戶而言,最重要的工作是應對越來越複雜的應用,它們都需要更快、更聰明且更具擴充性的網路。NVIDIA Mellanox 400G InfiniBand 的巨大吞吐量與智慧加速引擎,讓高效能運算、人工智慧與超大規模雲端基礎架構可以透過更低的成本與複雜性,達成無與倫比的效能。」
Exascale 等級的 AI 和高效能運算時代已經來臨,同時也帶來新的挑戰。由軟體定義、硬體加速、針對網路運算的可程式設計 NDR InfiniBand 產品將於 2021 年第二季推出樣本。NDR 產品的出現,將會大幅提升 Exascale 等級的 AI 和高效能運算系統的效能和效率,並簡化系統的管理和操作、降低系統的總擁有成本 (TCO),進而保護資料中心的投資。
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 【Synology_群暉科技新聞稿】Synology_參與_secutech2026,展示最新一站式_AI影像監控解決方案
- 華擎科技榮獲2026亞太史蒂夫獎「卓越創新」及「最受歡迎企業」雙獎 創新治理與品牌價值深受國際青睞
- 技嘉與 NVIDIA 合作推出 GeForce RTX 50 系列與《PRAGMATA》遊戲套裝 提升沉浸遊戲體驗
- 台北轉型全球創新戰略核心 COMPUTEX × InnoVEX 打造城市級全球科技舞台 從展館走向城市 打造具國際影響力的科技創新戰略平台
- NVIDIA 推出 RTX Remix 進階粒子視覺特效更新 《漫威爭鋒》GeForce 獎勵與 DLSS 遊戲更新同步登場
- Meta AI 商家助理於台灣開放測試!助品牌精準決策、社群行銷再升級! 廣告管理介面導入 AI 輔助 生成數據洞察報告、提供客製化策略
- AI 威脅與混合辦公夾擊企業防線,Jamf 擴大參與 Cybersec 2026 年資安大會 首度以資安品牌日與 Apple 體驗區回應行動資安新局
- 隨 AI 儲存需求加速成長,WD 樹立永續基礎架構新標準 FY2025 會計年度永續發展報告,揭示了業界的肯定、積極目標與突破性循環創新, 彰顯 WD 在 AI 驅動資料經濟中,引領打造永續且具成本效益的基礎架構
- 金士頓強化Design-In與工業級解決方案布局 全方位搶占市場領導地位
- Sandisk 於 NAB 2026 推出多款全新專業級記憶卡
- 不只為穿搭加分,LG Styler 從衣物狀態成就真正品味! 許光漢談維持衣物狀態的關鍵:細節,才是品味的開始
- 技嘉全新GAMING系列電源供應器 搭載獨家T-Guard守護頂級 GPU!
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
- JEDEC發布全新DDR5標準規範,從DDR5-4800起跳! 將加速導入下世代高效能電腦系統
- 不再是Toshiba品牌,全新Dynabook 2019 新品發布,透過運算與服務改變世界
- Mac 版 Office 2016 正式在台上市!
- microSD技術邁入第十年,SanDisk microSD記憶卡出貨量突破20億片
- 英特爾前進3D NAND,發表Intel SSD 600p、6000p、E 5420s、E 6000p、DC P3520、DC S3520固態硬碟!
