焦點
共綻光芒:經最佳化調整後的 Google Gemma 模型可在 NVIDIA GPU 上運行
文.圖/張國華 2024-02-23 14:02:39
Google 新推出的開放式語言模型在 TensorRT-LLM 的加速下,可在包括本地端 RTX AI PC 等 NVIDIA AI 平台上高速運行
NVIDIA 與 Google 合作本週推出了在所有NVIDIA AI 平台上適用於Gemma 模型的最佳化功能。Gemma 是 Google 最先進的新款輕量級開放式語言模型,擁有 20 億個和 70 億個參數,並可在任何地方運行,不僅可以降低成本,也能加快在特定領域使用場景上的創新。
NVIDIA 與 Google 雙方團隊進行密切合作,透過適用於最佳化大型語言模型推論作業的開源函式庫NVIDIA TensorRT-LLM,在資料中心或雲端環境運行的NVIDIA GPU,以及搭載 NVIDIA RTX GPU 的 PC 上,加速了 Gemma 的運行效能。值得一提的是,Gemma 使用與開發 Gemini 模型相同的研究成果和技術。
企業開發人員也可以運用NVIDIA 豐富的工具生態系統來微調 Gemma,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,並且在其生產應用程式中部署經過最佳化調整的模型。
深入了解 TensorRT-LLM 如何加快 Gemma 的推論速度,以及更多提供給開發人員的資訊。這包括 Gemma 的多個模型檢查點及模型的 FP8 量化版本,全都使用 TensorRT-LLM 完成最佳化調整。
敬請使用網頁瀏覽器開啟 NVIDIA AI Playground,便能直接體驗 Gemma 2B 及 Gemma 7B 的強大威力。
Chat with RTX 讓用戶可以輕鬆將 PC 上的本機端檔案連接到大型語言模型,使用自己的資料打造個人專屬的聊天機器人。
由於模型以本機端的方式運行,可以快速提供運行結果,並能夠讓使用者資料留在裝置上。Chat with RTX 與依賴雲端環境的 LLM 服務不同,讓用戶可以在本地端的 PC 上處理敏感資料,無需將資料分享給第三方或是連接到網路。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!
隨著香港電訊、日本So-net寬頻上網業者,陸續提供10G光纖上網,讓玩家與專業用戶享受高速上網的極速快感。反觀我們台灣,中華電信HiNet還在供裝光世代500M/250M與光世代1G/600M,可以說:「人家都上太空,我們還在殺豬公!!!」
NVIDIA 與 Google 合作本週推出了在所有NVIDIA AI 平台上適用於Gemma 模型的最佳化功能。Gemma 是 Google 最先進的新款輕量級開放式語言模型,擁有 20 億個和 70 億個參數,並可在任何地方運行,不僅可以降低成本,也能加快在特定領域使用場景上的創新。
NVIDIA 與 Google 雙方團隊進行密切合作,透過適用於最佳化大型語言模型推論作業的開源函式庫NVIDIA TensorRT-LLM,在資料中心或雲端環境運行的NVIDIA GPU,以及搭載 NVIDIA RTX GPU 的 PC 上,加速了 Gemma 的運行效能。值得一提的是,Gemma 使用與開發 Gemini 模型相同的研究成果和技術。
如此一來,開發者便能鎖定全球高效能 AI PC 上可用的超過一億顆 NVIDIA RTX GPU的安裝基礎進行開發。
開發者還能以雲端環境裡的 NVIDIA GPU 運行 Gemma 模型,包括在搭載 H100 Tensor 核心 GPU的 Google Cloud A3實體上運行,以及Google未來將引入的NVIDIA H200 Tensor 核心 GPU,該GPU擁有 141GB HBM3e 記憶體,每秒執行速度為 4.8 TB。企業開發人員也可以運用NVIDIA 豐富的工具生態系統來微調 Gemma,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,並且在其生產應用程式中部署經過最佳化調整的模型。
深入了解 TensorRT-LLM 如何加快 Gemma 的推論速度,以及更多提供給開發人員的資訊。這包括 Gemma 的多個模型檢查點及模型的 FP8 量化版本,全都使用 TensorRT-LLM 完成最佳化調整。
敬請使用網頁瀏覽器開啟 NVIDIA AI Playground,便能直接體驗 Gemma 2B 及 Gemma 7B 的強大威力。
Chat With RTX 即將支援 Gemma
Chat with RTX是一項使用檢索增強生成和 NVIDIA TensorRT-LLM 軟體的NVIDIA 技術展示內容,讓用戶在自己本地端有搭載 RTX 支援的 Windows PC 上就可以使用生成式人工智慧(AI)功能。這項工具也將加入支援 Gemma。Chat with RTX 讓用戶可以輕鬆將 PC 上的本機端檔案連接到大型語言模型,使用自己的資料打造個人專屬的聊天機器人。
由於模型以本機端的方式運行,可以快速提供運行結果,並能夠讓使用者資料留在裝置上。Chat with RTX 與依賴雲端環境的 LLM 服務不同,讓用戶可以在本地端的 PC 上處理敏感資料,無需將資料分享給第三方或是連接到網路。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!

- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 悅己經濟來臨!OVO 推 Warpple 短焦多功能投影機挑戰 CP 值天花板! 先進短焦技術畫面大 2.4 倍,影音唱歌 All-in-One 再享免費 VOD,預購免5千
- 「威剛 XPG MARS 980 BLADE SSD 2TB」實測開箱,「14,000 MB/s俱樂部」超越極限「第四代 PCIe 5.0 SSD」高效能低功耗固態硬碟!
- 創見發表工業級8TB大容量SSD, 內建斷電保護技術,保障資料安全
- 裝機美學新視界!ASUS Prime AP202全景機殼質感登場
- 科技結合嗅覺美學!華碩獨創香氛滑鼠正式登台
- 華為穿戴產品躍升2025年第一季全球穿戴市場第一 HUAWEI熱銷穿戴限時優惠,邀花粉同慶活力一夏!
- 《毀滅戰士:黑暗時代》將支援路徑追蹤,《聯邦控制局:防火組》上市即支援具有多畫格生成的 DLSS 4,NVIDIA 同步釋出新版 GeForce Game Ready 驅動程式
- 技嘉 MO27Q2A 280Hz QHD OLED 電競螢幕正式上市 通過ClearMR 15000認證的QHD高更新率OLED,打造更順暢的遊戲體驗
- 藍寶科技全系列顯示卡實體通路同步販售 Coolpc原價屋與Sinya欣亞數位 今日起全面開賣!
- 美光 HBM 導入 AMD AI 平台,實現高效能運算突破 美光的高頻寬記憶體(HBM3E 12 層堆疊 36GB記憶體)與 AMD Instinct MI350 系列 GPU 及平台攜手推動 AI 資料中心創新與成長
- 【TRYX LUCA L70】鏡映之境・無界之形:實踐 超現實精品機殼美學
- 精巧體積,極致效能 MONTECH 推出單塔散熱器NX400 ARGB
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- PLEXTOR S2C 512GB實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!
