PCDIY!業界新聞
全新NVIDIA Pascal GPU加速深度學習推論
(本資訊由廠商提供,不代表PCDIY!立場) 2016-09-21 18:37:53Tesla P4、P40加速器帶來高出45倍的人工智慧
TensorRT及DeepStream軟體提升人工智慧視訊推論
NVIDIA (輝達) 今天宣布推出 Pascal™ 架構深度學習平台的最新生力軍 NVIDIA® Tesla® P4 及P40 GPU 加速器與全新軟體,在效能及速度提供大幅度的提升以加速人工智慧服務的推論生產作業負載。
語音助理、待過濾垃圾郵件及電影與產品推薦引擎等現代人工智慧 (AI) 服務越來越複雜,與一年前的神經網路相比需要高出10倍的運算。目前以CPU為主的技術無法提供現代人工智慧服務所需要的即時回應能力,導致不佳的使用者經驗。
Tesla P4及P40 特別針對推論設計,使用經訓練的深度神經網路識別語音、影像及文字以回應使用者和裝置要求。Pascal架構 GPU具備以8位元 (INT8) 運算為主的專門推論指令,提供比CPU快45倍的反應速度(1),與不到一年前推出的GPU解決方案相比則提升了4倍(2)。
Tesla P4 為資料中心帶來最高的能源效率,其小尺寸及最小50瓦特的低功率設計可安裝於任何伺服器內,讓生產作業負載推論的能源效率達 CPU 的 40 倍(3)。在進行視訊推論作業負載(4)時,單一伺服器裡安裝單顆 Tesla P4 即可取代 13 台僅採用 CPU 的伺服器;而包含伺服器及用電量的總持有成本則能節省達8倍。
Tesla P40為深度學習作業負載帶來最大的處理量。一台搭載 8 顆 Tesla P40 加速器的伺服器擁有每秒47兆次運算 (TOPS) 的推論效能及 INT8 指令,可取代 140 台以上的 CPU 伺服器的效能(5)。若以每台 CPU 伺服器約 5,000 美元計算,可節省 65 萬美元以上的伺服器採購成本。
NVIDIA加速運算總經理Ian Buck表示:「有了 Tesla P100 以及新推出的 Tesla P4及P40,NVIDIA為資料中心提供唯一的端對端深度學習平台,為各大產業釋放龐大的人工智慧潛力。將訓練時間從數天大幅縮短至數小時,能立即解析資料,並透過人工智慧服務即時對消費者做出回應」。
實現更快速推論的軟體工具
另外與 Tesla P4 及 P40 推出的包含兩項加速人工智慧推論的創新軟體:NVIDIA TensorRT 及 NVIDIA DeepStream SDK。TensorRT為針對優化生產部署所設計的深度學習模型函式庫,具有立即回應極度複雜網路的能力。透過訓練過的 32 位元或 16 位元定義神經網路以及設定以降低精度的INT8運算為目的進行優化,將深度學習應用的處理量及效率極大化。
NVIDIA DeepStream SDK銜接強大的Pascal伺服器,與雙 CPU 只能處理7個串流(6)的運算能力相比,能即時同步解碼並分析高達 93 個 HD 視訊串流。這解決人工智慧的其中一項重大挑戰:處理大規模的影音內容分析以應用到如自駕車、互動式機器人、過濾及廣告投放等領域。深度學習整合至視訊應用中讓企業能提供前所未有、智慧且創新的視訊服務。
協助客戶向前邁進
NVIDIA的客戶提供越來越多需要最高運算效能的創新人工智慧服務。其中台灣廠商廣達持續在伺服器業務與 NVIDIA 合作,從世上首座人工智慧超級電腦系統 DGX-1、Facebook Big Sur 推論伺服器到搭載 NVIDIA 糖果盒大小 Tesla P4 輕巧 1U 伺服器,皆透過該公司而得以打造出優異的產品陣容。NVIDIA 共同創辦人暨執行長黃仁勳表示:「廣達從早期便與我們一同致力於GPU伺服器發展,不論想建造何種類型資料中心,透過我們與廣達及雲達的合作都能達成。」
雲達科技總經理楊晴華表示:「我們的客戶相當倚重雲達在超大規模 、高密度融合機架式等級解決方案中的領導地位,這些解決方案通常都需要高效能的作業負載。以深度學習的應用而言,平行運算回應之間的延遲性表現十分重要,而 Tesla P40 和 P4 正是能表現出準確與靈敏效能的新一代 GPU 解決方案。」
供貨時程
NVIDIA Tesla P4及P40 分別預定於11月及10月由各大ODM、OEM及通路合作夥伴供貨。(1) 以VGG-19神經網路、batch size = 4為基準比較延遲性。CPU:Xeon E5-2690v4,使用Intel MKL 2017。GPU:Tesla P40,使用TensorRT內部版本。針對Intel優化的VGG-19,來源https://github.com/intel/caffe/tree/master/models/mkl2017_vgg_19。
(2) 利用 Caffe GoogLeNet 神經網路、batch size = 128 比較 img/sec。用配備 8 顆 P40 的 GPU 伺服器與配備 8 顆 M40 的 GPU 伺服器做比較。兩者皆使用 TensorRT 內部版本。
(3) 利用Caffe AlexNet神經網路、batch size = 128比較img/sec。CPU:E5-2690v4,使用Intel MKL 2017。使用Intel優化的Caffe及AlexNet,來源https://github.com/intel/caffe。GPU:Tesla P4,量測GPU功率。
(4) 利用Intel優化的 GoogLeNet、雙插槽 CPU 伺服器、使用 Intel MKL 2017 的 Xeon E5-2650v4。使用 DeepStream SDK 的 1 顆 Tesla P4 GPU 伺服器。視訊串流為 720p @ 30FPS。
(5) 利用 Caffe GoogLeNet 神經網路、batch size = 128 比較 img/sec。雙插槽 CPU 伺服器、使用 Intel MKL 2017 的 Xeon E5-2690v4、358 images/sec。配備 8 顆 Tesla P40的GPU伺服器,使用TensorRT內部版本、52K images/sec,比CPU伺服器高出145倍的處理量。
(6) Intel優化的Caffe,使用雙插槽E5-2650 v4 CPU伺服器、Intel MKL 2017,以Intel優化的GoogLeNet為基礎:https://github.com/intel/caffe/tree/master/models/mkl2017_googlenet_v2,在 30FPS 時以 720p 執行轉碼。GPU:使用配備單顆 Tesla P4及雙插槽E5-2650 v4的CPU伺服器。
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- Synology參與secutech2026,展示最新一站式_AI影像監控解決方案
- 華擎科技榮獲2026亞太史蒂夫獎「卓越創新」及「最受歡迎企業」雙獎 創新治理與品牌價值深受國際青睞
- 技嘉與 NVIDIA 合作推出 GeForce RTX 50 系列與《PRAGMATA》遊戲套裝 提升沉浸遊戲體驗
- 台北轉型全球創新戰略核心 COMPUTEX × InnoVEX 打造城市級全球科技舞台 從展館走向城市 打造具國際影響力的科技創新戰略平台
- NVIDIA 推出 RTX Remix 進階粒子視覺特效更新 《漫威爭鋒》GeForce 獎勵與 DLSS 遊戲更新同步登場
- Meta AI 商家助理於台灣開放測試!助品牌精準決策、社群行銷再升級! 廣告管理介面導入 AI 輔助 生成數據洞察報告、提供客製化策略
- AI 威脅與混合辦公夾擊企業防線,Jamf 擴大參與 Cybersec 2026 年資安大會 首度以資安品牌日與 Apple 體驗區回應行動資安新局
- 隨 AI 儲存需求加速成長,WD 樹立永續基礎架構新標準 FY2025 會計年度永續發展報告,揭示了業界的肯定、積極目標與突破性循環創新, 彰顯 WD 在 AI 驅動資料經濟中,引領打造永續且具成本效益的基礎架構
- 金士頓強化Design-In與工業級解決方案布局 全方位搶占市場領導地位
- Sandisk 於 NAB 2026 推出多款全新專業級記憶卡
- 不只為穿搭加分,LG Styler 從衣物狀態成就真正品味! 許光漢談維持衣物狀態的關鍵:細節,才是品味的開始
- 技嘉全新GAMING系列電源供應器 搭載獨家T-Guard守護頂級 GPU!
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
- JEDEC發布全新DDR5標準規範,從DDR5-4800起跳! 將加速導入下世代高效能電腦系統
- 不再是Toshiba品牌,全新Dynabook 2019 新品發布,透過運算與服務改變世界
- Mac 版 Office 2016 正式在台上市!
- microSD技術邁入第十年,SanDisk microSD記憶卡出貨量突破20億片
- 英特爾前進3D NAND,發表Intel SSD 600p、6000p、E 5420s、E 6000p、DC P3520、DC S3520固態硬碟!
