焦點
共綻光芒:經最佳化調整後的 Google Gemma 模型可在 NVIDIA GPU 上運行
文.圖/張國華 2024-02-23 14:02:39
Google 新推出的開放式語言模型在 TensorRT-LLM 的加速下,可在包括本地端 RTX AI PC 等 NVIDIA AI 平台上高速運行
NVIDIA 與 Google 合作本週推出了在所有NVIDIA AI 平台上適用於Gemma 模型的最佳化功能。Gemma 是 Google 最先進的新款輕量級開放式語言模型,擁有 20 億個和 70 億個參數,並可在任何地方運行,不僅可以降低成本,也能加快在特定領域使用場景上的創新。
NVIDIA 與 Google 雙方團隊進行密切合作,透過適用於最佳化大型語言模型推論作業的開源函式庫NVIDIA TensorRT-LLM,在資料中心或雲端環境運行的NVIDIA GPU,以及搭載 NVIDIA RTX GPU 的 PC 上,加速了 Gemma 的運行效能。值得一提的是,Gemma 使用與開發 Gemini 模型相同的研究成果和技術。
企業開發人員也可以運用NVIDIA 豐富的工具生態系統來微調 Gemma,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,並且在其生產應用程式中部署經過最佳化調整的模型。
深入了解 TensorRT-LLM 如何加快 Gemma 的推論速度,以及更多提供給開發人員的資訊。這包括 Gemma 的多個模型檢查點及模型的 FP8 量化版本,全都使用 TensorRT-LLM 完成最佳化調整。
敬請使用網頁瀏覽器開啟 NVIDIA AI Playground,便能直接體驗 Gemma 2B 及 Gemma 7B 的強大威力。
Chat with RTX 讓用戶可以輕鬆將 PC 上的本機端檔案連接到大型語言模型,使用自己的資料打造個人專屬的聊天機器人。
由於模型以本機端的方式運行,可以快速提供運行結果,並能夠讓使用者資料留在裝置上。Chat with RTX 與依賴雲端環境的 LLM 服務不同,讓用戶可以在本地端的 PC 上處理敏感資料,無需將資料分享給第三方或是連接到網路。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!
隨著香港電訊、日本So-net寬頻上網業者,陸續提供10G光纖上網,讓玩家與專業用戶享受高速上網的極速快感。反觀我們台灣,中華電信HiNet還在供裝光世代500M/250M與光世代1G/600M,可以說:「人家都上太空,我們還在殺豬公!!!」
NVIDIA 與 Google 合作本週推出了在所有NVIDIA AI 平台上適用於Gemma 模型的最佳化功能。Gemma 是 Google 最先進的新款輕量級開放式語言模型,擁有 20 億個和 70 億個參數,並可在任何地方運行,不僅可以降低成本,也能加快在特定領域使用場景上的創新。
NVIDIA 與 Google 雙方團隊進行密切合作,透過適用於最佳化大型語言模型推論作業的開源函式庫NVIDIA TensorRT-LLM,在資料中心或雲端環境運行的NVIDIA GPU,以及搭載 NVIDIA RTX GPU 的 PC 上,加速了 Gemma 的運行效能。值得一提的是,Gemma 使用與開發 Gemini 模型相同的研究成果和技術。
如此一來,開發者便能鎖定全球高效能 AI PC 上可用的超過一億顆 NVIDIA RTX GPU的安裝基礎進行開發。
開發者還能以雲端環境裡的 NVIDIA GPU 運行 Gemma 模型,包括在搭載 H100 Tensor 核心 GPU的 Google Cloud A3實體上運行,以及Google未來將引入的NVIDIA H200 Tensor 核心 GPU,該GPU擁有 141GB HBM3e 記憶體,每秒執行速度為 4.8 TB。企業開發人員也可以運用NVIDIA 豐富的工具生態系統來微調 Gemma,包括配備 NeMo 框架和 TensorRT-LLM 的 NVIDIA AI Enterprise,並且在其生產應用程式中部署經過最佳化調整的模型。
深入了解 TensorRT-LLM 如何加快 Gemma 的推論速度,以及更多提供給開發人員的資訊。這包括 Gemma 的多個模型檢查點及模型的 FP8 量化版本,全都使用 TensorRT-LLM 完成最佳化調整。
敬請使用網頁瀏覽器開啟 NVIDIA AI Playground,便能直接體驗 Gemma 2B 及 Gemma 7B 的強大威力。
Chat With RTX 即將支援 Gemma
Chat with RTX是一項使用檢索增強生成和 NVIDIA TensorRT-LLM 軟體的NVIDIA 技術展示內容,讓用戶在自己本地端有搭載 RTX 支援的 Windows PC 上就可以使用生成式人工智慧(AI)功能。這項工具也將加入支援 Gemma。Chat with RTX 讓用戶可以輕鬆將 PC 上的本機端檔案連接到大型語言模型,使用自己的資料打造個人專屬的聊天機器人。
由於模型以本機端的方式運行,可以快速提供運行結果,並能夠讓使用者資料留在裝置上。Chat with RTX 與依賴雲端環境的 LLM 服務不同,讓用戶可以在本地端的 PC 上處理敏感資料,無需將資料分享給第三方或是連接到網路。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!

- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- EDIFIER S300 旗艦喇叭新上市 復古設計與 Hi-Fi 等級音質 打造專屬你的居家美學 復古感性設計增添優雅情懷 讓聆聽饗宴成就雋永流行時尚
- 4K微型投影霸主再出擊!LG CineBeam S小銀河Ultra震撼登場 比書還不占空間!超短焦39.3公分投影百吋畫面 預購熱銷破 2,200 萬!
- 「威剛 XPG GAMMIX S70 BLADE SSD 2TB 」實測開箱,「7,000MB/s俱樂部」PCIe 4.0 固態硬碟!
- Copilot+ PC熱銷搶市 體驗華碩AI筆電呷冰度盛夏!
- TP-Link 四大新品發表!Wi-Fi 7 路由器 × 智慧家庭新品齊發 momo 品牌日限時下殺 7 折起,全屋網速、居家安防一次升級趁現在!
- 空氣清淨機市占霸主LG推出全新PuriCare_AeroBooster
- NVIDIA 技術驅動的自動化與機器人的解決方案 於台北國際自動化工業大展中夥伴攤位上亮相
- APMIC「PrivModel 服務方案」全面支援 gpt-oss,準確率提升 40%、推論成本減 90% 同步任命美國總經理陳尹鈞,強化北美市場佈局、推動企業私有化 AI 全球落地
- Lenovo全新ThinkShield 解決方案進化登場 為中小企業及組織建構智慧資安防線
- 「技嘉 GIGABYTE GeForce RTX 5070 GAMING OC 12G」實測開箱,DLSS 4火力佳持「2K 遊戲新王者」主流級電競顯示卡!
- AI女神李珠珢 x Logitech/Logitech G雙品牌代言人正式登場! 親揭軟萌形象外的高效生活與遊戲愛用選物清單 日夜都離不開的3C Top 5推薦
- 走過十年有米相伴!全台歡慶小米之家十週年 百萬豪禮週週抽 父親節寵爸不手軟!8 月人氣手機與智慧家電限時優惠最高直降萬元起
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- 「浦科特 PLEXTOR S2C 512GB SSD」實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!
