焦點
共綻光芒:經最佳化調整後的 Google Gemma 模型可在 NVIDIA GPU 上運行
文.圖/張國華 2024-02-23 14:02:39
Google 新推出的開放式語言模型在 TensorRT-LLM 的加速下,可在包括本地端 RTX AI PC 等 NVIDIA AI 平台上高速運行
NVIDIA 與 Google 合作本週推出了在所有NVIDIA AI 平台上適用於Gemma 模型的最佳化功能。Gemma 是 Google 最先進的新款輕量級開放式語言模型,擁有 20 億個和 70 億個參數,並可在任何地方運行,不僅可以降低成本,也能加快在特定領域使用場景上的創新。
NVIDIA 與 Google 雙方團隊進行密切合作,透過適用於最佳化大型語言模型推論作業的開源函式庫NVIDIA TensorRT-LLM,在資料中心或雲端環境運行的NVIDIA GPU,以及搭載 NVIDIA RTX GPU 的 PC 上,加速了 Gemma 的運行效能。值得一提的是,Gemma 使用與開發 Gemini 模型相同的研究成果和技術。
企業開發人員也可以運用NVIDIA 豐富的工具生態系統來微調 Gemma,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,並且在其生產應用程式中部署經過最佳化調整的模型。
深入了解 TensorRT-LLM 如何加快 Gemma 的推論速度,以及更多提供給開發人員的資訊。這包括 Gemma 的多個模型檢查點及模型的 FP8 量化版本,全都使用 TensorRT-LLM 完成最佳化調整。
敬請使用網頁瀏覽器開啟 NVIDIA AI Playground,便能直接體驗 Gemma 2B 及 Gemma 7B 的強大威力。
Chat with RTX 讓用戶可以輕鬆將 PC 上的本機端檔案連接到大型語言模型,使用自己的資料打造個人專屬的聊天機器人。
由於模型以本機端的方式運行,可以快速提供運行結果,並能夠讓使用者資料留在裝置上。Chat with RTX 與依賴雲端環境的 LLM 服務不同,讓用戶可以在本地端的 PC 上處理敏感資料,無需將資料分享給第三方或是連接到網路。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!
隨著香港電訊、日本So-net寬頻上網業者,陸續提供10G光纖上網,讓玩家與專業用戶享受高速上網的極速快感。反觀我們台灣,中華電信HiNet還在供裝光世代500M/250M與光世代1G/600M,可以說:「人家都上太空,我們還在殺豬公!!!」
NVIDIA 與 Google 合作本週推出了在所有NVIDIA AI 平台上適用於Gemma 模型的最佳化功能。Gemma 是 Google 最先進的新款輕量級開放式語言模型,擁有 20 億個和 70 億個參數,並可在任何地方運行,不僅可以降低成本,也能加快在特定領域使用場景上的創新。
NVIDIA 與 Google 雙方團隊進行密切合作,透過適用於最佳化大型語言模型推論作業的開源函式庫NVIDIA TensorRT-LLM,在資料中心或雲端環境運行的NVIDIA GPU,以及搭載 NVIDIA RTX GPU 的 PC 上,加速了 Gemma 的運行效能。值得一提的是,Gemma 使用與開發 Gemini 模型相同的研究成果和技術。
如此一來,開發者便能鎖定全球高效能 AI PC 上可用的超過一億顆 NVIDIA RTX GPU的安裝基礎進行開發。
開發者還能以雲端環境裡的 NVIDIA GPU 運行 Gemma 模型,包括在搭載 H100 Tensor 核心 GPU的 Google Cloud A3實體上運行,以及Google未來將引入的NVIDIA H200 Tensor 核心 GPU,該GPU擁有 141GB HBM3e 記憶體,每秒執行速度為 4.8 TB。企業開發人員也可以運用NVIDIA 豐富的工具生態系統來微調 Gemma,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,並且在其生產應用程式中部署經過最佳化調整的模型。
深入了解 TensorRT-LLM 如何加快 Gemma 的推論速度,以及更多提供給開發人員的資訊。這包括 Gemma 的多個模型檢查點及模型的 FP8 量化版本,全都使用 TensorRT-LLM 完成最佳化調整。
敬請使用網頁瀏覽器開啟 NVIDIA AI Playground,便能直接體驗 Gemma 2B 及 Gemma 7B 的強大威力。
Chat With RTX 即將支援 Gemma
Chat with RTX是一項使用檢索增強生成和 NVIDIA TensorRT-LLM 軟體的NVIDIA 技術展示內容,讓用戶在自己本地端有搭載 RTX 支援的 Windows PC 上就可以使用生成式人工智慧(AI)功能。這項工具也將加入支援 Gemma。Chat with RTX 讓用戶可以輕鬆將 PC 上的本機端檔案連接到大型語言模型,使用自己的資料打造個人專屬的聊天機器人。
由於模型以本機端的方式運行,可以快速提供運行結果,並能夠讓使用者資料留在裝置上。Chat with RTX 與依賴雲端環境的 LLM 服務不同,讓用戶可以在本地端的 PC 上處理敏感資料,無需將資料分享給第三方或是連接到網路。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!
隨著香港電訊、日本So-net寬頻上網業者,陸續提供10G光纖上網,讓玩家與專業用戶享受高速上網的極速快感。反觀我們台灣,中華電信HiNet還在供裝光世代500M/250M與光世代1G/600M,可以說:「人家都上太空,我們還在殺豬公!!!」- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 芝奇宣布 2026 世界盃超頻大賽正式登場,賽事總獎金高達 40,000 美金!
- 2026年2月11日 2026 MSI春季健檢開跑 六大產品線享十大免費健檢服務項目 再抽品牌精美周邊和QD-OLED電競螢幕
- TrendForce: 記憶體漲勢加劇終端售價壓力,2026年全球手機產量恐面臨顯著衰退風險
- 技嘉攜手 NVIDIA 推出《Resident Evil Requiem》遊戲套裝 強化沉浸遊戲體驗
- 買技嘉/AORUS精選產品《人中之龍 極3 / 人中之龍3外傳 Dark Ties》免費送
- 技嘉攜手 AMD 推出《Crimson Desert》遊戲套裝 全面升級極致遊戲體驗
- 華碩舉辦「商用解決方案交流會」,吸引超過百家ISV軟體服務夥伴
- 快搶!TUF Gaming《黑色行動7》特別版顯示卡超限量上市
- 首跨科普漫畫力作 《 ROG OMNI 無懼特攻 》電競信仰力爆棚
- 宏正榮獲TIPS A級驗證 深化專利治理展現永續韌性
- 「TRYX STAGE 創氪星系 影域」破框而出的視覺革命,「L 型立體微縮劇場」重塑空間的維度與邊界,實現 TDP:280W 解熱能力!
- NetApp 資料平台強力應援第 60 屆超級盃足球賽 智慧型資料基礎架構全面升級利惠體育場的觀賽體驗
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- 「浦科特 PLEXTOR S2C 512GB SSD」實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!