PCDIY!業界新聞
NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍
(本資訊由廠商提供,不代表PCDIY!立場) 2020-06-23 18:08:49
NVIDIA (輝達) 剛向世人展現出一舉刷新舊紀錄的堅強實力,將運行 TPCx-BB 這項大數據分析基準的效能表現提高近20倍。
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
NVIDIA 使用由 16 台NVIDIA DGX A100 系統支援的
RAPIDS開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。
所有系統忙碌運行:各項軟硬體齊頭並進,達到全速前進的結果
我們在進行分析之際,實際結果的重要性不言而喻;而在實際環境中,組織使用人工智慧 (AI) 來取得深入的見解。TPCx-BB 基準測試在進行查詢時,是使用 SQL 和機器學習來處理結構化資料,以及使用自然語言處理和非結構化資料,反映出現代資料分析工作流程中的多樣性。這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。
在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了Dask,在超高速通訊方面則用上了
UCX開源函式庫,並且全都在 DGX A100 上加速運行。
DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構NVIDIA A100 Tensor Core GPU與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。
平行處理創造出無與倫比的效能表現
TPCx-BB 是一個用於企業的大數據基準,代表現實環境中的 ETL (擷取、轉換、載入) 與機器學習工作流程。該基準的三十個查詢項目包括庫存管理、價格分析、銷售分析、推薦系統、客戶區隔和觀點分析等大數據分析使用案例。儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。
在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。
大數據規模的高效率測試基準
在 SF10000 TPCx-BB 的規模方面,NVIDIA 的測試結果代表著分析 10TB 以上資料量的表現。透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。
NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。
開放源碼社群通力合作,加快發展腳步
許多合作夥伴與開源團體積極參與RAPIDS TPCx-BB 基準這項專案。將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。
少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。
欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於RAPIDS的資訊,請瀏覽 rapids.ai。
延伸閱讀
(01) 技嘉為NVIDIA A100 PCIe GPU推出眾多G系列伺服器產品組合(02) NVIDIA ISC 2020 (上):發表全新A100 PCIe運算加速卡,比V100快20倍! 聯袂SXM卡、UFM Cyber-AI、RAPIDS評測軟體亮相
(03) NVIDIA ISC 2020 (下):TOP 500超級電腦排名中,NV擁有333款,佔2/3強,另Selene超級電腦求單出爐
(04) NVIDIA 刷新大數據分析基準的紀錄,RAPIDS 資料科學軟體在 DGX A100 上高速運行將TPCx-BB的運算表現一舉提高了19.5倍 (本篇)
(05) TOP500 榜單上的超級電腦採用 NVIDIA 技術,以達到加速節能的目標
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 華碩商用市佔冠軍!領航AI時代 以資安與高效驅動企業升級
- 網石宣布全新AFK RPG《THE KING OF FIGHTERS AFK》 將於9月4日全球上市!
- 暴雪與微星攜手發佈《魔獸世界:至暗之夜》
- 十銓科技推出 T-CREATE EXPERT CKD DDR5桌上型記憶體 CKD、大容量雙引擎領航未來 全面釋放 AI 時代專業創作力
- 自動化展秀實力!華碩AI全場景應用 引領智造新未來
- 「POCO 嘉年華」 歡慶 7 周年 重磅祭出年度最強好康! 電量怪獸 POCO M7 強勢登場!多款熱銷機種瘋搶折扣 再抽 3 萬東京旅遊! POCO M7 電池容量大躍進 沉浸式超大螢幕更過癮! 六重好禮加碼送 超值優惠享不完!
- TrendForce: AI資料中心將規模化導入液冷散熱技術,估2025年滲透率逾30%
- 酷澎價格搶市、蝦皮反攻「速度」超全家 BOXFUL 白皮書揭 2025 電商進入「物流決戰期」
- Fortinet推FortiCloud服務更新,升級現代企業混合辦公安全
- 工業 AI 漲勢可期 Moxa 揭櫫應用落地三大關鍵
- EDIFIER S300 旗艦喇叭新上市 復古設計與 Hi-Fi 等級音質 打造專屬你的居家美學 復古感性設計增添優雅情懷 讓聆聽饗宴成就雋永流行時尚
- 4K微型投影霸主再出擊!LG CineBeam S小銀河Ultra震撼登場 比書還不占空間!超短焦39.3公分投影百吋畫面 預購熱銷破 2,200 萬!
最多人點閱
- Microsoft Azure Certified for IoT 快速打造智慧物聯網
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- 英特爾舉辦亞洲區創新高峰會 促進台灣與全亞洲產業體系的創新發展
- IEM於台北國際電玩展熱血開打,購買Intel Core i5/i7處理器系列+SSD 750即得限量好禮
- 深根台灣成就萬物相聯 2015 ARM®新竹辦公室擴大營運暨亞洲第一座CPU設計中心開幕
- AMD發表全球首款GPU硬體虛擬化產品線
- PLEXTOR感恩節大回饋,M6V卡禮來雙重送!
- 希捷科技:2016年六大科技趨勢
- 台灣微軟與Lamigo聯手 應援總冠軍封王賽「Win for 10」!
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- AMD獲選2015年道瓊永續性指數 連續14年榮獲此殊榮
- 全球體積最小最省電的狂熱級顯示卡,AMD Radeon R9 Nano引領4K遊戲體驗帶入客廳!
