PCDIY!業界新聞
NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍
(本資訊由廠商提供,不代表PCDIY!立場) 2020-06-23 18:08:49
NVIDIA (輝達) 剛向世人展現出一舉刷新舊紀錄的堅強實力,將運行 TPCx-BB 這項大數據分析基準的效能表現提高近20倍。
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
所有系統忙碌運行:各項軟硬體齊頭並進,達到全速前進的結果
我們在進行分析之際,實際結果的重要性不言而喻;而在實際環境中,組織使用人工智慧 (AI) 來取得深入的見解。TPCx-BB 基準測試在進行查詢時,是使用 SQL 和機器學習來處理結構化資料,以及使用自然語言處理和非結構化資料,反映出現代資料分析工作流程中的多樣性。這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
平行處理創造出無與倫比的效能表現
TPCx-BB 是一個用於企業的大數據基準,代表現實環境中的 ETL (擷取、轉換、載入) 與機器學習工作流程。該基準的三十個查詢項目包括庫存管理、價格分析、銷售分析、推薦系統、客戶區隔和觀點分析等大數據分析使用案例。儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
大數據規模的高效率測試基準
在 SF10000 TPCx-BB 的規模方面,NVIDIA 的測試結果代表著分析 10TB 以上資料量的表現。透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
開放源碼社群通力合作,加快發展腳步
許多合作夥伴與開源團體積極參與RAPIDS TPCx-BB 基準這項專案。將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
延伸閱讀
(01) 技嘉為NVIDIA A100 PCIe GPU推出眾多G系列伺服器產品組合(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 燦坤3C家電 x SAMSUNG交心日5/15登場 推出「五星級」(有省錢)生活提案 交心價63折起 滿額享星級好禮 燦坤內湖旗艦店放大絕!5/16祭1元競標 50吋QLED智慧顯示器 買到賺到! 「燦坤3C家電 x SAMSUNG交心日」旗艦手機最高賺破萬 摺疊機下殺2字頭
- TrendForce:輕資產策略下,台系面板廠積極轉進半導體先進封裝、光通訊領域
- AMD以AMD Instinct MI430X GPU FP64效能樹立高效能運算新標竿
- Red Hat AI 全面升級,與建置人員及營運人員邁向 AI 代理未來 Red Hat AI 全新「硬體底層至智慧代理」功能為跨混合雲環境中擴展模型與自主式代理奠定基礎
- 第四梯次IC Taiwan Grand Challenge 十一家新創出列 可望強化資料中心、半導體設計驗證實力 帶動無人機、機器人創新應用發展
- 當尖端科技遇上經典賽事:Lenovo 限量推出Yoga Slim 7i Ultra Aura FIFA World Cup 26 Edition 演繹運動美學新境界 同場加映:專為玩家而生的新一代電競筆電 Legion 5i 、LOQ
- 技嘉多款板卡筆電榮獲COMPUTEX 2026 Best Choice Award 肯定以AI為主軸的關鍵技術研發打造完整跨平台智能生態系
- 趨勢科技TrendLife揭AI時代下台灣消費者三大防詐意識現況 七成以上民眾用AI處理人生大事,但對AI詐騙辨識信心度不足 AI防詐達人新增高風險判斷與社群影片掃描功能,助民眾遠離詐騙
- OPPO Find X9 Ultra挾10倍光學長焦、雙2億畫素鏡頭來襲 為專業創作而生!挑戰成為用戶的「下一台專業相機」 Ultra機型首度走入國際市場 台灣將有上市規劃
- IDC 調查:亞太企業加速轉型 多重混合雲成關鍵驅動力
- LG gram Pro 再創輕薄巔峰!革新材質登場 設計美學全面躍升 攜手韓國人氣插畫家 Mr. Donothing 限量聯名贈品與快閃體驗驚喜登場
- 技嘉科技於 COMPUTEX 2026 以「Future Landing」主題展出,用全域端到端 AI 基礎建設突破實作關鍵時刻
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
- JEDEC發布全新DDR5標準規範,從DDR5-4800起跳! 將加速導入下世代高效能電腦系統
- 不再是Toshiba品牌,全新Dynabook 2019 新品發布,透過運算與服務改變世界
- Mac 版 Office 2016 正式在台上市!
- microSD技術邁入第十年,SanDisk microSD記憶卡出貨量突破20億片
- 英特爾前進3D NAND,發表Intel SSD 600p、6000p、E 5420s、E 6000p、DC P3520、DC S3520固態硬碟!
