焦點

AWS 上的 NVIDIA NIM 微服務大幅增強 AI 推論能力

文.圖/張國華 2024-12-05 12:15:09

生成式人工智慧(AI)正在快速改變各產業的發展樣貌,帶動對安全且高效能推論解決方案的需求,以有效率又具備成本效益的方式擴充日益複雜的模型。

擴大與 NVIDIA 的合作範圍,Amazon Web Services(AWS)今日在 AWS re:Invent 年度大會上宣布已經將NVIDIA NIM 微服務擴展至主要的 AWS AI 服務,以支援更快速的 AI 推論,以及減少生成式 AI 應用的延遲時間。

NVIDIA NIM 微服務現在可以直接在 AWS Marketplace、Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 取得,讓開發人員可以更輕鬆為常用模型大規模部署經過 NVIDIA 最佳化的推論功能。

NVIDIA NIM 是 AWS Marketplace 提供的 NVIDIA AI Enterprise 軟體平台一部分,為開發人員提供一套簡單易用的微服務,專為在跨雲端、資料中心和工作站安全可靠地部署高效能、企業級 AI 模型推論而設計。

這些預先建置的容器建置在強大的推論引擎上,例如 NVIDIA Triton 推論伺服器、NVIDIA TensorRT、NVIDIA TensorRT-LLM 與 PyTorch,並支援廣泛的 AI 模型,從開源社群模型到 NVIDIA AI Foundation 模型與客製化模型。

NIM 微服務可以部署於各種 AWS 服務,包括 Amazon Elastic Compute Cloud(EC2)、Amazon Elastic Kubernetes Service(EKS)、Amazon Machine Image(AMI)及 Amazon SageMaker。

開發人員可以在NVIDIA API 目錄上預覽超過 100 個由常用模型與模型系列所建立起的 NIM 微服務,包括 Meta 的 Llama 3、Mistral AI 的 Mistral 與 Mixtral、NVIDIA Nemotron、Stability AI 的 SDXL 等。最常用的模型都可自行託管部署在 AWS 服務上,並且經過最佳化,能夠在 AWS 上的 NVIDIA 加速運算執行個體上運行。

現在可直接在 AWS 上取得的 NIM 微服務包含:

● NVIDIA Nemotron-4 可在 Amazon Bedrock Marketplace、Amazon SageMaker Jumpstart 和 AWS Marketplace 上取得。這是一款尖端的大型語言模型,專門用於產生近似真實世界資料的多樣化合成資料,可增強多個領域客製化大型語言模型的效能與穩健性。
● Llama 3.1 8B-Instruct 開放在 AWS Marketplace 上取得。這個有著 80 億個參數的多語言大型語言模型已針對語言理解、推理和文字產生使用個案進行預先訓練及指令調校。
● Llama 3.1 70B-Instruct 可以在 AWS Marketplace 上取得。這個有著 700 億個參數,且完成預先訓練、指令調校的模型已針對多語言對話進行最佳化。
● Mixtral 8x7B Instruct v0.1 能夠在 AWS Marketplace 上使用。這個權重開源的高品質稀疏混合專家模型可以遵循指令、完成請求與產生創意的文字格式。

AWS 上適用於每個人的 NIM

各產業的客戶及合作夥伴都在利用 AWS 上的 NIM 來加快上市速度、維持生成式 AI 應用與資料的安全性及控制力,並降低成本。

IT 諮詢與數位服務供應商 SoftServe 已開發出六個完全部署在 AWS 上,且由 NVIDIA NIM 與 AWS 服務加速的生成式 AI 解決方案。這些解決方案在 AWS Marketplace 上提供,包括 SoftServe Gen AI Drug Discovery、SoftServe Gen AI Industrial Assistant、Digital Concierge、Multimodal RAG System、Content Creator 和 Speech Recognition Platform。

這些解決方案均以 NVIDIA AI Blueprints 為基礎,這套全面性的參考工作流程能夠加快開發和部署 AI 應用,並且具備 NVIDIA 加速函式庫、軟體開發套件及 NIM 微服務,適用於 AI 代理、數位孿生等方面。

立即開始使用 AWS 上的 NIM

開發人員可以按照自己的獨特需求與要求,在 AWS 上部署 NVIDIA NIM 微服務。如此一來,開發人員和企業就能藉由各種 AWS 服務,利用經過 NVIDIA 最佳化的推論容器發展出高效能 AI。

歡迎造訪 NVIDIA API 目錄試用超過 100 種不同的 NIM 最佳化模型,並且申請開發人員授權或 90 天的 NVIDIA AI Enterprise 試用授權,即可開始在 AWS 服務上部署微服務。開發人員也可以在 AWS Marketplace、Amazon Bedrock Marketplace 或 Amazon SageMaker JumpStart 探索 NIM 微服務。

請參閱有關軟體產品資訊的通知。

→更多的【PCDIY!業界新聞】: 請見

→更多的【PCDIY!賣場情報】: 請見

→更多的【PCDIY!科技情報】: 請見

→更多的【IT資訊新聞】: 請見

→更多的【ITMan!資訊經理人】: 請見

→更多的【PCDIY!八卦】: 請見

延伸閱讀

(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!











































發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。

最近新增