PCDIY!業界新聞
NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍
(本資訊由廠商提供,不代表PCDIY!立場) 2020-06-23 18:08:49
NVIDIA (輝達) 剛向世人展現出一舉刷新舊紀錄的堅強實力,將運行 TPCx-BB 這項大數據分析基準的效能表現提高近20倍。
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
所有系統忙碌運行:各項軟硬體齊頭並進,達到全速前進的結果
我們在進行分析之際,實際結果的重要性不言而喻;而在實際環境中,組織使用人工智慧 (AI) 來取得深入的見解。TPCx-BB 基準測試在進行查詢時,是使用 SQL 和機器學習來處理結構化資料,以及使用自然語言處理和非結構化資料,反映出現代資料分析工作流程中的多樣性。這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
平行處理創造出無與倫比的效能表現
TPCx-BB 是一個用於企業的大數據基準,代表現實環境中的 ETL (擷取、轉換、載入) 與機器學習工作流程。該基準的三十個查詢項目包括庫存管理、價格分析、銷售分析、推薦系統、客戶區隔和觀點分析等大數據分析使用案例。儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
大數據規模的高效率測試基準
在 SF10000 TPCx-BB 的規模方面,NVIDIA 的測試結果代表著分析 10TB 以上資料量的表現。透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
開放源碼社群通力合作,加快發展腳步
許多合作夥伴與開源團體積極參與RAPIDS TPCx-BB 基準這項專案。將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
延伸閱讀
(01) 技嘉為NVIDIA A100 PCIe GPU推出眾多G系列伺服器產品組合(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 芝奇宣布 2026 世界盃超頻大賽正式登場,賽事總獎金高達 40,000 美金!
- 2026年2月11日 2026 MSI春季健檢開跑 六大產品線享十大免費健檢服務項目 再抽品牌精美周邊和QD-OLED電競螢幕
- TrendForce: 記憶體漲勢加劇終端售價壓力,2026年全球手機產量恐面臨顯著衰退風險
- 技嘉攜手 NVIDIA 推出《Resident Evil Requiem》遊戲套裝 強化沉浸遊戲體驗
- 買技嘉/AORUS精選產品《人中之龍 極3 / 人中之龍3外傳 Dark Ties》免費送
- 技嘉攜手 AMD 推出《Crimson Desert》遊戲套裝 全面升級極致遊戲體驗
- 華碩舉辦「商用解決方案交流會」,吸引超過百家ISV軟體服務夥伴
- 快搶!TUF Gaming《黑色行動7》特別版顯示卡超限量上市
- 首跨科普漫畫力作 《 ROG OMNI 無懼特攻 》電競信仰力爆棚
- 宏正榮獲TIPS A級驗證 深化專利治理展現永續韌性
- 「TRYX STAGE 創氪星系 影域」破框而出的視覺革命,「L 型立體微縮劇場」重塑空間的維度與邊界,實現 TDP:280W 解熱能力!
- NetApp 資料平台強力應援第 60 屆超級盃足球賽 智慧型資料基礎架構全面升級利惠體育場的觀賽體驗
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
- JEDEC發布全新DDR5標準規範,從DDR5-4800起跳! 將加速導入下世代高效能電腦系統
- 不再是Toshiba品牌,全新Dynabook 2019 新品發布,透過運算與服務改變世界
- Mac 版 Office 2016 正式在台上市!
- microSD技術邁入第十年,SanDisk microSD記憶卡出貨量突破20億片
- 英特爾前進3D NAND,發表Intel SSD 600p、6000p、E 5420s、E 6000p、DC P3520、DC S3520固態硬碟!
