PCDIY!業界新聞
NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍
(本資訊由廠商提供,不代表PCDIY!立場) 2020-06-23 18:08:49
NVIDIA (輝達) 剛向世人展現出一舉刷新舊紀錄的堅強實力,將運行 TPCx-BB 這項大數據分析基準的效能表現提高近20倍。
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
所有系統忙碌運行:各項軟硬體齊頭並進,達到全速前進的結果
我們在進行分析之際,實際結果的重要性不言而喻;而在實際環境中,組織使用人工智慧 (AI) 來取得深入的見解。TPCx-BB 基準測試在進行查詢時,是使用 SQL 和機器學習來處理結構化資料,以及使用自然語言處理和非結構化資料,反映出現代資料分析工作流程中的多樣性。這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
平行處理創造出無與倫比的效能表現
TPCx-BB 是一個用於企業的大數據基準,代表現實環境中的 ETL (擷取、轉換、載入) 與機器學習工作流程。該基準的三十個查詢項目包括庫存管理、價格分析、銷售分析、推薦系統、客戶區隔和觀點分析等大數據分析使用案例。儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
大數據規模的高效率測試基準
在 SF10000 TPCx-BB 的規模方面,NVIDIA 的測試結果代表著分析 10TB 以上資料量的表現。透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
開放源碼社群通力合作,加快發展腳步
許多合作夥伴與開源團體積極參與RAPIDS TPCx-BB 基準這項專案。將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
延伸閱讀
(01) 技嘉為NVIDIA A100 PCIe GPU推出眾多G系列伺服器產品組合(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 《無限暖暖》1.7版本「藍淚季」重拾被遺忘的珍寶吧!
- ENERMAX 36 週年感恩回饋,旗艦效能輕鬆擁有 史無前例業界最強CP 值 限時搶購!金牌電源CyberG II 限定
- MONTECH推出X5 與 X5M:定義無妥協的全新標準
- 燦坤3C家電7/10開賣Nintendo Switch 2瑪利歐賽車世界同捆組合 7/10當天到燦坤11家指定門市 每店前20名送燦坤限定獨家贈品 燦坤全台門市與燦坤線上購物網站刷指定銀行信用卡購Switch 2享限量最高現折520元+燦坤K幣無上限 舊換新再加碼10% 燦坤推出SAMSUNG Galaxy Z系列新機與Watch系列新錶預購活動 買就送獨家「星動大禮包」 買指定手機憑消費發票抽限
- 極致6K超高解析!ProArt PA32QCV創作者螢幕驚豔上市
- 企業須留意!AI深偽助長高階主管、徵才流程與KYC詐騙 趨勢科技揭露採用深偽(deepfake)技術的網路犯罪劇本
- LG推出「RADIO OPTIMISM」全球品牌活動 台灣限定「美好生活電台」即日起限時開播! 攜手KKBOX 用音樂促進社交連結 傳遞正向能量
- NVIDIA 推出 GeForce Summer Nights 抽獎活動;宣布具有多畫格生成的 DLSS 4 開始支援《凡人 Online 2》、《Brickadia》和《盧恩傳奇:龍荒秘境》等三款遊戲大作
- ROG三創旗艦店定義電競未來!開幕限定福利吸引玩家朝聖
- 扎根創新人才 華碩加入臺大AI 電資大聯盟
- 裝備整齊,踏入充滿神話與謎團的黑暗奇幻世界,與 MSI 一同展開冒險 購買指定QD-OLED產品,即可獲得《明末:淵虛之羽》!
- Lenovo 推出搭載NVIDIA RTX 50系列筆電陣容 新一代Legion 與 LOQ 電競系列在台熱烈登場 導入Legion獨家Coldfront Hyper高階散熱系統,Lenovo重新定義次世代電競筆電新標準
最多人點閱
- Microsoft Azure Certified for IoT 快速打造智慧物聯網
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- 英特爾舉辦亞洲區創新高峰會 促進台灣與全亞洲產業體系的創新發展
- IEM於台北國際電玩展熱血開打,購買Intel Core i5/i7處理器系列+SSD 750即得限量好禮
- 深根台灣成就萬物相聯 2015 ARM®新竹辦公室擴大營運暨亞洲第一座CPU設計中心開幕
- AMD發表全球首款GPU硬體虛擬化產品線
- PLEXTOR感恩節大回饋,M6V卡禮來雙重送!
- 希捷科技:2016年六大科技趨勢
- 台灣微軟攜手台大電機 高中程式夏令營獲佳評
- 台灣微軟與Lamigo聯手 應援總冠軍封王賽「Win for 10」!
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- AMD獲選2015年道瓊永續性指數 連續14年榮獲此殊榮
