焦點
輕量級冠軍:NVIDIA 發表有著最先進精確度的小型語言模型 Mistral-NeMo-Minitron 8B 模型為日前發表的Mistral NeMo 12B 模型的縮小版,精確度高且具備在 GPU 加速的資料中心、雲端與工作站上運行模型的運算效率
文.圖/陳信榮 2024-08-22 14:56:45生成式人工智慧(AI)的開發者通常得面臨要取捨模型大小還是精確度的難題。不過 NVIDIA 發表的全新語言模型倒是兼具兩者之長,這個模型體積小巧,又有著最先進的精確度。
Mistral-NeMo-Minitron 8B 是Mistral AI 與 NVIDIA 在上個月共同發表開放式 Mistral NeMo 12B 模型的縮小版。Mistral-NeMo-Minitron 8B小到可以在 NVIDIA RTX 驅動的工作站上運行,同時在由 AI 支援的聊天機器人、虛擬助理、內容產生器和教育工具的多項基準測試中,表現依然十分出色。NVIDIA 使用開發客製化生成式 AI 的端對端平台 NVIDIA NeMo 蒸餾(distillation)出Minitron 模型。
NVIDIA 應用深度學習研究部門副總裁 Bryan Catanzaro 表示:「我們將兩種最佳化AI的方法加在一起。這包括以剪枝的方式將 Mistral NeMo 的 120 億個參數縮減為 80 億個,並且採用蒸餾方式提高精確度。這麼一來便能降低 Mistral-NeMo-Minitron 8B 的運算成本,又可以提供媲美原始模型的精確度。」
小型語言模型可以即時在工作站和筆記型電腦上執行,這一點跟大型語言模型不同。此舉使得資源有限的組織更容易在基礎設施中部署生成式 AI 功能,又能取得最佳的成本、運作效率和能源使用程度。由於無需從邊緣裝置將資料傳送到伺服器,在邊緣裝置上以本機端的方式運行語言模型另外有著安全性方面的優勢。
開發人員可以透過包裝成有著標準應用程式介面(API)的 NVIDIA NIM 微服務使用Mistral-NeMo-Minitron 8B,或從 Hugging Face 下載模型。此NVIDIA NIM也即將開放下載,可以在數分鐘內部署在任何 GPU 加速系統上。
最先進的 80 億個參數
與類似大小的模型相比,Mistral-NeMo-Minitron 8B 模型在九個熱門的語言模型基準測試均處於領先地位。這些基準涵蓋各種任務,包括語言理解、常識推理、數學推理、總結、編碼以及產生真實答案的能力。Mistral-NeMo-Minitron 8B 模型包裝成 NVIDIA NIM 微服務,並且最佳化至最佳狀態,有著低延遲的特色,能加快回應使用者的速度,並有高輸送量以降低生產環境的運算成本。
開發人員在某些情況下可能想要使用更小的模型,以便在智慧型手機或機器人等嵌入式裝置上運行。他們為此可以下載有著 80 億個參數的模型,並針對企業特定的應用程式使用 NVIDIA AI Foundry 剪枝和蒸餾出較小且最佳的神經網路。
AI Foundry 平台與服務為開發人員提供完整堆疊解決方案,協助他們客製化基礎模型,並且將其包裝成 NIM 微服務。AI Foundry 平台與服務提供熱門的基礎模型、NVIDIA NeMo 平台與 NVIDIA DGX Cloud 上的專用容量。使用 NVIDIA AI Foundry 的開發人員同樣能夠使用 NVIDIA AI Enterprise,這個提供安全性、穩定性及支援部署到生產環境的軟體平台。
由於原版的 Mistral-NeMo-Minitron 8B 模型一開始就有著最先進的精確度,因此使用 AI Foundry 瘦身後的版本依舊只要極少的訓練資料與運算基礎設施,就能達到高精確度的表現。
利用剪枝與蒸餾的優點
研究團隊用剪枝加上蒸餾的方法,讓較小的模型達到高精確度表現。剪枝會去除掉對精確度影響最小的模型權重(weight),以縮小神經網路的規模。研究團隊在蒸餾模型時,會在一個小資料集上重新訓練這個修剪過的模型,以大幅提升在修剪過程中降低的精確度。這麼一來可以得到一個更小又更有效率的模型,其預測精確度可媲美較大的模型。
這項技術代表只要使用原始資料集的一小部分,就能訓練一系列相關模型裡每個額外的模型,這跟從頭訓練一個較小的模型相比,剪枝和蒸餾一個較大的模型可以省下高達 40 倍的運算成本。
更多詳情請閱讀NVIDIA技術部落格與技術報告。
NVIDIA 在本週還發表了另一個小型語言模型 Nemotron-Mini-4B-Instruct,這個模型針對NVIDIA GeForce RTX AI PC 與筆記型電腦上低記憶體使用率與更快回應時間最佳化。這個模型以 NVIDIA NIM 微服務形式提供,讓開發人員可以部署到雲端與裝置上。而它也是 NVIDIA ACE 的一部分,NVIDIA ACE 是一套製作數位人類的技術,提供由生成式 AI 支援的語音、智慧與動畫。
透過瀏覽器或 ai.nvidia.com 上的 API,體驗這兩個包裝成 NIM 微服務的模型。
請參閱軟體產品資訊的通知事項
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!

- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 1Q25 OLED監視器出貨量年增175%,華碩市占升至第二名TrendForce: 1Q25 OLED監視器出貨量年增175%,華碩市占升至第二名
- EDIFIER E 系列藍牙串流喇叭登台 聆聽感受與外型質感全面升級 首推 ES300 華麗亮相 打造全天候的療癒氛圍 ES20 和 ES60 小方咚 雙喇叭 TWS 串聯技術讓音場更立體
- Openfind Information Technology, Inc. Openfind MailBase 榮獲 2025 首屆智慧創新大賞佳作殊榮
- V-COLOR推出全球首款 DDR5 OC RDIMM RGB, 容量最高達512GB(64GBx8),速度達8000MT/s
- 艾思科與旗下品牌科賦將於 COMPUTEX TAIPEI 2025 展出最新產品 極速效能.質感設計.全面進化
- TrendForce: 美關稅政策搖擺不定,經濟、消費需求放緩恐成MLCC市場2H25最大隱憂
- 芝奇將於Computex 2025展示多款全新記憶體,並舉辦年度超頻活動及極限電腦改裝大賞
- 2025 SecuTech 安防展Omada / VIGI 展區五大亮點搶先看 Omada 網路 VIGI 監控全方位網安一體整合方案震撼登場
- 東擎科技搶先推出AiFDO 引領邊緣裝置安全自動上線新時代
- 你喝的水乾淨嗎?LG PuriCare 淨水 Bar 飲水機首度登台! 機內自動高溫殺菌、全流程潔淨 引領飲水新標準
- 《2025 TSRL曜越模擬賽車極速爭霸聯賽-春季聯賽》 總決賽冠軍誕生
- Synology 推出全新機種「DS925+、DS1525+ 與 DS1825+」,2025 年式 NAS 為高效且可靠的資料管理需求而設計
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- PLEXTOR S2C 512GB實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!
