焦點
AMD Ryzen AI 300系列處理器釋放消費級大型語言模型的巔峰效能
文.圖/陳信榮 2024-11-07 20:45:50語言模型自GPT-2以來已取得大幅進步,使用者現在可以藉由LM Studio等消費級應用程式快速且輕鬆地部署高度複雜的大型語言模型(LLM)。透過與AMD合作,這些工具讓每個人都能使用人工智慧(AI),且無需任何編碼或技術知識。
llama.cpp和LM Studio概述
LM Studio基於llama.cpp項目,是一個廣受歡迎的框架,用於快速且輕鬆地部署語言模型。LM Studio沒有相依性(dependencies),僅使用CPU即可進行加速,亦支援GPU加速功能。LM Studio使用AVX2指令集來加速基於x86 CPU的現代LLM。效能對比:吞吐量和延遲
AMD Ryzen AI為這些最先進的工作負載進行加速,在x86筆電上運行LM Studio等基於llama.cpp的應用程式提供領先業界的效能註1。值得注意的是,LLM通常對記憶體速度非常敏感。
在我們的對比測試中,Intel筆電的RAM實際上速度較快,達到8533 MT/s,而AMD筆電的RAM為7500 MT/s。儘管如此,AMD Ryzen AI 9 HX 375處理器的每秒token生成速度(tokens per second)比競爭對手快出高達27%。參考資料顯示tokens per second (tk/s)是測量LLM輸出token速度的指標,大約對應於每秒在螢幕上顯示的字數。
AMD Ryzen AI 9 HX 375處理器在Meta Llama 3.2 1b Instruct(4-bit量化)中可實現每秒高達50.7個token的效能。
對大型語言模型進行基準測試的另一個指標是「輸出首個token的時間(time to first token)」,測量從提交提示(prompt)至模型開始生成token之間的延遲時間。在較大模型中,基於AMD “Zen 5”架構的Ryzen AI HX 375處理器的速度相較競爭對手的同級處理器快出高達3.5倍註1。
在Windows中使用可變顯示記憶體(VGM)來提高模型吞吐量
AMD Ryzen AI CPU中的三個加速器各自擁有特定的工作負載專業化和擅長的情境。基於AMD XDNA 2架構的NPU在執行Copilot+工作負載時為持續的AI功能提供卓越的功耗效率,CPU為工具和框架提供廣泛的覆蓋範圍和相容性,而內顯(iGPU)通常根據需求處理AI任務。LM Studio提供llama.cpp的連接埠(port),可使用與供應商無關(vendor-agnostic)的Vulkan API來加速框架。此加速通常取決於硬體功能和Vulkan API的驅動程式最佳化的組合。與僅使用CPU模式相比,在LM Studio中開啟GPU offload後Meta Llama 3.2 1b Instruct的效能平均提升31%。Mistral Nemo 2407 12b Instruct等較大模型在token生成階段由於受到頻寬限制,平均效能提升5.1%。
我們觀察到在LM Studio中使用基於Vulkan的llama.cpp版本並開啟GPU offload時,與僅使用CPU的模式相比,競爭對手處理器除了其中一個模型外,其餘測試模型的平均效能皆明顯較低。因此,為了保持對比測試的公平性,我們沒有將Intel Core Ultra 7 258v在LM Studio中使用基於Vulkan之Llama.cpp的GPU-offload效能納入比較。
AMD Ryzen AI 300系列處理器還包括一項名為可變顯示記憶體(VGM)的功能。通常程式會利用為iGPU分配的512 MB專用記憶區塊,以及位於系統RAM「共享」部分的第二個記憶區塊。VGM讓使用者將512 MB的「專用」分配擴展到高達75%的可用系統RAM容量。這種連續記憶體的分配顯著提升了對記憶體敏感應用程式的吞吐量。
在開啟VGM(16GB)後,Meta Llama 3.2 1b Instruct的效能平均提升22%,與使用iGPU加速並結合VGM的CPU模式相比,平均速度共提升60%。Mistral Nemo 2407 12b Instruct等更大模型相較僅使用CPU的模式,帶來高達17%的效能提升。
同步比較:Mistral 7b Instruct 0.3
儘管競爭對手的筆電在LM Studio中使用基於Vulkan的Llama.cpp版本沒有提供加速,我們仍使用Intel AI Playground應用程式(基於IPEX-LLM和LangChain)來比較iGPU效能,力求在最佳的消費級LLM體驗之間進行公平的比較。我們使用Intel AI Playground提供的模型,即Mistral 7b Instruct v0.3和Microsoft Phi 3.1 Mini Instruct。在LM Studio中使用可比較的量化後,我們發現AMD Ryzen AI 9 HX 375在Phi 3.1的速度比競爭對手快8.7%,在Mistral 7b Instruct 0.3的速度則快13%。
AMD致力於推進AI技術的發展,讓每個人皆能使用AI。若最新的AI進展被設置在高門檻的技術或編碼技能,這目標將無法實現,這就是為何LM Studio等應用如此重要。除了能夠快速且輕鬆地在本地部署LLM外,這些應用程式讓使用者在llama.cpp項目支援該架構的情況下,第一時間體驗最先進的模型。
AMD Ryzen AI加速器提供卓越效能,開啟VGM等功能可為AI使用案例提供更好的效能。所有因素結合起來後,為x86筆電上的語言模型提供了令人驚豔的使用者體驗。
欲親自體驗LM Studio,請參閱此連結。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!

- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 技嘉科技發表GeForce RTX 5050系列顯示卡
- 「技嘉GIGABYTE MO27Q2 Gaming Monitor電競螢幕」強勢來襲,採用「時尚美學設計,QD-OLED驚艷視覺,240Hz極速顯示,絕佳黑階顯色,優質動態表現,超薄質感底座,電競戰術功能,三年烙印保固」獲原價屋店長肯定推薦「遊戲打怪神兵利器」制霸遊戲戰場價格:15,490元!
- 《Mecha BREAK》、《暗黑破壞神 IV》等熱門遊戲大作開始支援具有多畫格生成的 DLSS 4 ,NVIDIA 推出支援 GeForce RTX 5050 顯示卡的 GeForce Game Ready 驅動程式
- D-Link友訊科技印度再下一城 高毛利商用大單、MIT路由器雙箭齊發
- 美光提升 PC 效能,推出自適應寫入技術和 G9 QLC NAND 美光 2600 SSD 以 QLC的經濟效益,提供超越 TLC 主流固態硬碟的使用者體驗
- 摺疊機王者再出招!Motorola 寵粉打造瘦子專場派對 razr 60系列搭電信優惠0元入手 再抽RIMOWA精品好禮
- Belkin 首間直營店進駐台北三創生活園,正式插旗台灣! 限時推出滿額贈禮與福袋抽獎活動
- 連天王周杰倫也愛的乾淨呵護完美兼顧 專為品味型男量身打造 飛利浦全新 XP9000 系列旗艦奢享智能電鬍刀 主打「淨護一體不妥協」
- 微星發佈最新的 AMD AGESA Combo PI-1.2.0.3e BIOS 支援所有 64GBx4 記憶體和全新一代處理器
- WAVE 2025 一次看見完整 AI 生態系!7月31日台北世貿一館將登場 AI 科技 × 政策資源 × 國際視野 三日論壇引爆全民 AI 實力!
- MESH聚達創投集團迎成立十周年 扮全球電子產業創新投資關鍵推手 集結國際潛力新創硬體與電子供應鏈 獨家MESH NETWORK賦能投資人深度參與科技創新
- Epson品牌迎來50周年,感謝全球用戶支持 秉持「創造與挑戦」、「誠實努力」的精神、持續成為受客戶所支持且信賴的品牌
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- 「浦科特 PLEXTOR S2C 512GB SSD」實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!