PCDIY!業界新聞
NVIDIA 的推論效能突破讓雲端到邊緣的對話式人工智慧變得更聰明、更具互動性,TensorRT 8 為醫療照護、汽車與金融界的頂尖企業提供全球最快的人工智慧推論效能
(本資訊由廠商提供,不代表PCDIY!立場) 2021-07-21 09:49:35NVIDIA (輝達) 今天推出第八代人工智慧 (AI) 軟體 TensorRT 8,讓語言查詢的推論時間減半,並讓開發人員得以打造全世界最高效能的搜尋引擎、廣告建議與聊天機器人,並能從雲端到邊緣提供這些服務。
TensorRT 8 的優化只需要 1.2 毫秒就能在 BERT-Large 上達到破紀錄的語言應用速度,而 BERT-Large 是全世界最被廣泛使用的 Transformer 模型之一。企業以往只能縮小模型的大小,但也因此造成較低的精準度,如今有了 TensorRT 8,企業可以把模型的大小擴增兩倍或三倍,並大幅提升精準度。
NVIDIA 開發人員計劃事業部副總裁 Greg Estes 表示:「AI 模型正以指數級的速度變得越來越複雜,而全球各地對於使用 AI 的即時應用需求也隨之高漲。這讓企業迫切地部署最新的推論解決方案。最新版本的 TensorRT 導入全新的功能,可以讓企業把對話式 AI 應用交付給客戶,並達到過去無法企及的品質水準和反應速度。」
來自醫療照護、汽車、金融與零售業等各領域的 2.75 萬家公司、超過 35 萬名開發人員,在過去五年已經累積近 250 萬次的 TensorRT 下載量。TensorRT 的應用可以部署在超大規模資料中心、嵌入式或汽車產品平台。
最新的推論創新
除了 Transformer 的優化,TensorRT 8 還透過另外兩個關鍵功能達成 AI 推論的突破。稀疏性 (sparsity) 是 NVIDIA Ampere 架構 GPU 中用以提升效率的效能技術,可以讓開發人員藉由減少運算作業以加速神經網路。
量化感知訓練讓開發人員可以在不犧牲精準度的情況下,運用已訓練好的模型和 INT8 的精度運行推論,這讓他們在 Tensor 核心上進行高效率推論時,可以大幅減少運算與儲存的時間。
廣泛的業界支持
各產業的領導業者紛紛採用 TensorRT 打造對話式 AI 與各種領域的深度學習推論應用。Hugging Face 是全球各產業的 AI 服務供應商所仰賴的開源 AI 頂尖企業,該公司與 NVIDIA 密切合作,以導入能大規模執行文字分析、神經搜尋與對話式應用的開創性 AI 服務。
Hugging Face 產品總監 Jeff Boudier 表示:「我們與 NVIDIA 密切合作,在 NVIDIA GPU 上運行最新的模型並達到最高效能。Hugging Face Accelerated Inference API 已經為透過 NVIDIA GPU 驅動的 Transformer 模型提升高達一百倍的速度。有了 TensorRT 8,Hugging Face 在 BERT 上可達到僅一毫秒的推論延遲,我們也很興奮將在今年稍晚提供這樣的高效能服務給客戶。」
提供醫療技術、診斷學及數位解決方案的創新國際企業 GE Healthcare 正使用 TensorRT 協助加速超音波的電腦視覺應用。超音波是疾病初期檢測的重要工具,此應用可以讓臨床醫師透過該公司的智慧醫療照護解決方案,提供最高品質的照護服務。
GE Healthcare 心血管超音波事業部總工程師 Erik Steen 表示:「談到超音波,臨床醫師總得耗費寶貴的時間挑選並測量影像。在 Vivid Patient Care Elevated Release 的研發前期,我們希望在 Vivid E95 超音波掃描儀上實作自動化心臟檢查,讓整個流程更有效率。心臟辨識演算法會選擇適當的影像進行心臟壁動作分析,TensorRT 具備即時的推論能力,可以提升檢測演算法的效能,同時縮短研發專案的產品上市時程。」
供應時程
TensorRT 8 已正式推出並提供 NVIDIA 開發人員計劃成員免費使用。最新版本的外掛程式、剖析器與範例,也以開源碼的方式放在 TensorRT GitHub 儲存庫供取用。- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 美的角度都驚豔!motorola edge 60 fusion 美型 AI 新機登場 Motorola打造拍得出色、看得驚豔、最懂你的全方位手機! Panton 時尚色彩認證、AI 智慧影像、軍規級防護 edge 60 fusion 與 g56 上市
- TrendForce: 傳Tesla暫停生產Optimus,技術瓶頸將引領人型機器人產業轉型
- 今夏出遊這樣玩 Instagram! 「編輯網格」自由調整個人檔案排版 「語音訊息」延長至五分鐘 滿足話匣子分享欲
- 西門子 EDA 推全新解決方案,助力簡化複雜的 3D IC 設計與分析流程
- NetApp 獲 SE Labs 肯定 鞏固全球資料儲存安全領域領導地位 NetApp 榮獲 2025 年 SE Labs 企業級資料保護獎
- LG明星商品大升級!WashTower™ 第二代 洗乾全AI,護衣、節能又省時! 容量提升、全觸控中央控制液晶面板,智慧科技與極簡美型一次到位!
- 從 AI 到永續!PaGamO 全能電競聚焦教育未來力,攜手企業共育新世代 偏鄉晉級制首登場打破城鄉差距,參賽人數成長逾三成再創新高
- FUN暑假 布袋戲棚首度搬進燦坤3C家電 假日熱鬧好去處 來燦坤內湖旗艦店聽音樂、看熱舞、欣賞霹靂布袋戲
- 「TAMASHII EXHIBITION 2025 IN TAICHUNG」 6月27日至7月6日於中友百貨盛大舉辦 全新系列《機動戰士鋼彈GQuuuuuuX》登陸台中 《超人力霸王》、《獵人》、《七龍珠》、《JoJo的奇妙冒險》等人氣作品盛大登場
- D-Link友訊科技深耕日本市場20年 商用、電信雙引擎動能齊發
- 2025年7月7日 最新高效能筆電與掌機全線展出 MSI打造《龍魂城解鎖行動》實境互動體驗 週末限時登場
- 小尺寸 大能量!金士頓 NV3 2230 固態硬碟 行動娛樂 × 工作效能雙進化
最多人點閱
- Microsoft Azure Certified for IoT 快速打造智慧物聯網
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- 英特爾舉辦亞洲區創新高峰會 促進台灣與全亞洲產業體系的創新發展
- IEM於台北國際電玩展熱血開打,購買Intel Core i5/i7處理器系列+SSD 750即得限量好禮
- 深根台灣成就萬物相聯 2015 ARM®新竹辦公室擴大營運暨亞洲第一座CPU設計中心開幕
- AMD發表全球首款GPU硬體虛擬化產品線
- PLEXTOR感恩節大回饋,M6V卡禮來雙重送!
- 希捷科技:2016年六大科技趨勢
- 台灣微軟攜手台大電機 高中程式夏令營獲佳評
- 台灣微軟與Lamigo聯手 應援總冠軍封王賽「Win for 10」!
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- AMD獲選2015年道瓊永續性指數 連續14年榮獲此殊榮
