焦點
AWS 上的 NVIDIA NIM 微服務大幅增強 AI 推論能力
文.圖/張國華 2024-12-05 12:15:09生成式人工智慧(AI)正在快速改變各產業的發展樣貌,帶動對安全且高效能推論解決方案的需求,以有效率又具備成本效益的方式擴充日益複雜的模型。
擴大與 NVIDIA 的合作範圍,Amazon Web Services(AWS)今日在 AWS re:Invent 年度大會上宣布已經將NVIDIA NIM 微服務擴展至主要的 AWS AI 服務,以支援更快速的 AI 推論,以及減少生成式 AI 應用的延遲時間。
NVIDIA NIM 微服務現在可以直接在 AWS Marketplace、Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 取得,讓開發人員可以更輕鬆為常用模型大規模部署經過 NVIDIA 最佳化的推論功能。
NVIDIA NIM 是 AWS Marketplace 提供的 NVIDIA AI Enterprise 軟體平台一部分,為開發人員提供一套簡單易用的微服務,專為在跨雲端、資料中心和工作站安全可靠地部署高效能、企業級 AI 模型推論而設計。
這些預先建置的容器建置在強大的推論引擎上,例如 NVIDIA Triton 推論伺服器、NVIDIA TensorRT、NVIDIA TensorRT-LLM 與 PyTorch,並支援廣泛的 AI 模型,從開源社群模型到 NVIDIA AI Foundation 模型與客製化模型。
NIM 微服務可以部署於各種 AWS 服務,包括 Amazon Elastic Compute Cloud(EC2)、Amazon Elastic Kubernetes Service(EKS)、Amazon Machine Image(AMI)及 Amazon SageMaker。
開發人員可以在NVIDIA API 目錄上預覽超過 100 個由常用模型與模型系列所建立起的 NIM 微服務,包括 Meta 的 Llama 3、Mistral AI 的 Mistral 與 Mixtral、NVIDIA Nemotron、Stability AI 的 SDXL 等。最常用的模型都可自行託管部署在 AWS 服務上,並且經過最佳化,能夠在 AWS 上的 NVIDIA 加速運算執行個體上運行。
現在可直接在 AWS 上取得的 NIM 微服務包含:
● NVIDIA Nemotron-4 可在 Amazon Bedrock Marketplace、Amazon SageMaker Jumpstart 和 AWS Marketplace 上取得。這是一款尖端的大型語言模型,專門用於產生近似真實世界資料的多樣化合成資料,可增強多個領域客製化大型語言模型的效能與穩健性。● Llama 3.1 8B-Instruct 開放在 AWS Marketplace 上取得。這個有著 80 億個參數的多語言大型語言模型已針對語言理解、推理和文字產生使用個案進行預先訓練及指令調校。
● Llama 3.1 70B-Instruct 可以在 AWS Marketplace 上取得。這個有著 700 億個參數,且完成預先訓練、指令調校的模型已針對多語言對話進行最佳化。
● Mixtral 8x7B Instruct v0.1 能夠在 AWS Marketplace 上使用。這個權重開源的高品質稀疏混合專家模型可以遵循指令、完成請求與產生創意的文字格式。
AWS 上適用於每個人的 NIM
各產業的客戶及合作夥伴都在利用 AWS 上的 NIM 來加快上市速度、維持生成式 AI 應用與資料的安全性及控制力,並降低成本。IT 諮詢與數位服務供應商 SoftServe 已開發出六個完全部署在 AWS 上,且由 NVIDIA NIM 與 AWS 服務加速的生成式 AI 解決方案。這些解決方案在 AWS Marketplace 上提供,包括 SoftServe Gen AI Drug Discovery、SoftServe Gen AI Industrial Assistant、Digital Concierge、Multimodal RAG System、Content Creator 和 Speech Recognition Platform。
這些解決方案均以 NVIDIA AI Blueprints 為基礎,這套全面性的參考工作流程能夠加快開發和部署 AI 應用,並且具備 NVIDIA 加速函式庫、軟體開發套件及 NIM 微服務,適用於 AI 代理、數位孿生等方面。
立即開始使用 AWS 上的 NIM
開發人員可以按照自己的獨特需求與要求,在 AWS 上部署 NVIDIA NIM 微服務。如此一來,開發人員和企業就能藉由各種 AWS 服務,利用經過 NVIDIA 最佳化的推論容器發展出高效能 AI。歡迎造訪 NVIDIA API 目錄試用超過 100 種不同的 NIM 最佳化模型,並且申請開發人員授權或 90 天的 NVIDIA AI Enterprise 試用授權,即可開始在 AWS 服務上部署微服務。開發人員也可以在 AWS Marketplace、Amazon Bedrock Marketplace 或 Amazon SageMaker JumpStart 探索 NIM 微服務。
請參閱有關軟體產品資訊的通知。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!
隨著香港電訊、日本So-net寬頻上網業者,陸續提供10G光纖上網,讓玩家與專業用戶享受高速上網的極速快感。反觀我們台灣,中華電信HiNet還在供裝光世代500M/250M與光世代1G/600M,可以說:「人家都上太空,我們還在殺豬公!!!」- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- NVIDIA 推出 RTX Remix 進階粒子視覺特效更新 《漫威爭鋒》GeForce 獎勵與 DLSS 遊戲更新同步登場
- Meta AI 商家助理於台灣開放測試!助品牌精準決策、社群行銷再升級! 廣告管理介面導入 AI 輔助 生成數據洞察報告、提供客製化策略
- AI 威脅與混合辦公夾擊企業防線,Jamf 擴大參與 Cybersec 2026 年資安大會 首度以資安品牌日與 Apple 體驗區回應行動資安新局
- 隨 AI 儲存需求加速成長,WD 樹立永續基礎架構新標準 FY2025 會計年度永續發展報告,揭示了業界的肯定、積極目標與突破性循環創新, 彰顯 WD 在 AI 驅動資料經濟中,引領打造永續且具成本效益的基礎架構
- 金士頓強化Design-In與工業級解決方案布局 全方位搶占市場領導地位
- Sandisk 於 NAB 2026 推出多款全新專業級記憶卡
- 不只為穿搭加分,LG Styler 從衣物狀態成就真正品味! 許光漢談維持衣物狀態的關鍵:細節,才是品味的開始
- 技嘉全新GAMING系列電源供應器 搭載獨家T-Guard守護頂級 GPU!
- 全漢FSP再出手,電源升級送好禮、機殼 $200 帶回家 第二波優惠開跑:白金電源送電競延長線、$200電競小機殼輕鬆入手
- NVIDIA GPU 加速 Adobe Premiere 全新調色模式 大幅提升調色效率 全新 NVIDIA RTX 加速功能簡化 Adobe Premiere 創作工作流程,透過 NVIDIA Project G-Assist 實現系統最佳化
- MSI 全新商務產品線PRO MAX系列 打造高效生產力與舒適視覺體驗的最佳選擇
- TrendForce: 成本上調帶動,預估2Q26動力電芯價格續漲
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- 「浦科特 PLEXTOR S2C 512GB SSD」實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!