ITMan!資訊新聞
Amazon OpenSearch Serverless向量引擎預覽版正式推出 助力客戶輕鬆打造現代生成式AI應用
文.圖/張國華 2023-08-01 12:54:43
Amazon Web Services(AWS)宣布推出Amazon OpenSearch Serverless向量引擎預覽版。該向量引擎在Amazon OpenSearch Serverless中提供了一種簡單、可拓展、高效能的相似性搜尋功能,讓用戶能夠輕鬆打造由現代化機器學習(ML)的增強搜尋體驗和生成式AI應用程式,毋須管理底層向量資料庫基礎設施。
機器學習的增強搜尋應用和生成式AI的應用程式都需要使用向量嵌入,向量嵌入作為文本、圖像、音訊和影片資料的數位表示,可以用來生成動態的相關內容。向量嵌入基於使用者私有資料進行訓練,代表資訊的語義和內容屬性。理想情況下,這些嵌入可以就近儲存和管理,如接近現有的搜尋引擎或資料庫等特定領域資料集。由此,企業能夠透過處理用戶查詢找到最近的向量,並將它們與其他詮釋資料結合,進而整合搜尋結果。這一過程完全毋須依賴外部資料來源或其它應用程式。客戶希望向量資料庫是易於打造的,且便於從原型設計快速進入到生產環境,這樣他們就可以將精力集中在創建差異化應用程式上。Amazon OpenSearch Serverless向量引擎擴展了Amazon OpenSearch的搜尋能力,使使用者能夠即時儲存、搜尋和追溯數十億向量嵌入,並精確進行相似性匹配和語義搜尋,毋須考慮底層基礎設施。
Amazon OpenSearch Serverless向量引擎由開源OpenSearch專案中的k近鄰(kNN)搜尋功能提供支援,該功能能夠提供可靠而精確的結果。如今,許多客戶在託管集群中使用OpenSearch kNN搜尋,以便在應用程式中提供語義搜尋和個人化推薦。向量引擎的使用者體驗與Serverless環境一樣簡單易用。向量引擎支援歐氏距離、餘弦相似度和內積等常用的距離指標,可容納16,000個維度,因此非常適合支援各種基礎模型及其他AI/ML模型。使用者還可以儲存各種資料的不同欄位,例如詮釋資料中的數位、布林值、日期、關鍵字和地理位置,以及包含描述性資訊的文本等,來為儲存的向量添加更多上下文資訊。多種類型資料的合併能降低複雜性,提升可維護性,並且避免資料重複、版本相容性挑戰和授權問題,有效地簡化應用程式棧。向量引擎支援相同的OpenSearch開源套件API,讓用戶可以充分利用其豐富的查詢功能,例如全文檢索搜尋、進階篩選、聚合、地理空間查詢、巢狀查詢,以加快資料檢索和增強搜尋結果。以要求查找距離用戶15英里以內的結果的應用為例,向量引擎可以在單個查詢中完成這項任務,而不需要維護兩個不同系統,並利用應用邏輯將結果合併。透過整合LangChain、Amazon Bedrock和Amazon SageMaker,用戶可以輕鬆地將偏好的機器學習和AI系統與向量引擎整合。
向量引擎支援不同領域的廣泛應用,包括圖像搜尋、文檔搜尋、音樂檢索、產品推薦、影片搜尋、基於位置的搜尋、詐騙偵測以及異常偵測。AWS預測,將詞彙搜尋方法與先進的機器學習和生成式AI功能結合的混合搜尋將會日益流行。例如,當使用者在電子商務網站上搜尋「紅色襯衫」時,語義搜尋透過檢索所有紅色來擴大搜尋範圍,同時在詞法(BM25演算法)搜尋上調整和強化邏輯。利用Amazon OpenSearch篩選功能,企業可以為用戶提供基於尺寸、品牌、價格範圍和附近商店存貨狀況等資訊來優化搜尋選項,進一步強化搜尋結果的關聯性,以便打造更個人化、更精準的體驗。向量引擎支援的混合搜尋使得用戶能夠在單個查詢調用中查詢向量嵌入、詮釋資料和描述性資訊,進而在不建立複雜應用程式碼的情況下,輕鬆地提供更準確的、與上下文相關的搜尋結果。
在向量引擎正式可用之前,AWS計畫推出兩項功能來降低客戶首個集合的成本。第一項功能是新的開發-測試(dev-test)選項,它能讓使用者在沒有備份或副本的情況下啟動集合,進而將入門成本降低50%。向量引擎仍然提供持久性保證,因為它將所有資料保存在Amazon S3中。第二項功能是在初始階段配置0.5 OCU(OpenSearch計算單位)資源,資源將根據使用者的實際工作負載來擴展;如果初始工作負載的規模是數萬到數十萬個向量(取決於維度數量),用戶則可以進一步降低成本。除了這兩項功能外,AWS將把支援使用者首個集合所需的最低OCU從每小時4個降至每小時1個。
AWS還在開發一些新功能,在未來幾個月,將會實現工作負載暫停與恢復能力,這項新功能對向量引擎十分有用,因為許多應用不需要持續索引資料。
最後,AWS持續致力於優化向量圖的效能和記憶體使用,包括改進快取和合併等功能。
在AWS致力於降低用戶成本的同時,AWS將提供1400 OCU小時/每月的免費向量集合,直到開發-測試選項宣布可用為止。
Amazon OpenSearch Serverless向量引擎預覽版現已在全球八個Region可用:美國東部(俄亥俄州)、美國東部(維吉尼亞州北部)、美國西部(奧勒岡州)、亞太地區(新加坡)、亞太地區(雪梨)、亞太地區(東京)、歐洲(法蘭克福)和歐洲(愛爾蘭)。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!
隨著香港電訊、日本So-net寬頻上網業者,陸續提供10G光纖上網,讓玩家與專業用戶享受高速上網的極速快感。反觀我們台灣,中華電信HiNet還在供裝光世代500M/250M與光世代1G/600M,可以說:「人家都上太空,我們還在殺豬公!!!」
向量嵌入幫助機器學習的增強搜尋和生成式AI的應用
所有產業的企業都在迅速採用生成式AI,因為它能夠處理龐大的資料集、生成自動化內容,並提供媲美人類的互動式回應。透過整合聊天機器人、問答系統和個人化推薦等先進的對話生成式AI應用程式,客戶正在想方設法澈底變革終端使用者體驗以及與數位平台的交流。這些對話應用程式讓使用者能夠用自然語言進行搜尋和查詢,並透過理解語義、用戶意圖和查詢上下文,生成酷似人類的回應。機器學習的增強搜尋應用和生成式AI的應用程式都需要使用向量嵌入,向量嵌入作為文本、圖像、音訊和影片資料的數位表示,可以用來生成動態的相關內容。向量嵌入基於使用者私有資料進行訓練,代表資訊的語義和內容屬性。理想情況下,這些嵌入可以就近儲存和管理,如接近現有的搜尋引擎或資料庫等特定領域資料集。由此,企業能夠透過處理用戶查詢找到最近的向量,並將它們與其他詮釋資料結合,進而整合搜尋結果。這一過程完全毋須依賴外部資料來源或其它應用程式。客戶希望向量資料庫是易於打造的,且便於從原型設計快速進入到生產環境,這樣他們就可以將精力集中在創建差異化應用程式上。Amazon OpenSearch Serverless向量引擎擴展了Amazon OpenSearch的搜尋能力,使使用者能夠即時儲存、搜尋和追溯數十億向量嵌入,並精確進行相似性匹配和語義搜尋,毋須考慮底層基礎設施。
探索向量引擎功能
打造於Amazon OpenSearch Serverless的向量引擎得益於其穩健的架構。使用向量引擎,使用者不必擔心後端基礎設施的大小選擇、調整和縮放問題。向量引擎可自動調整資源,來適應不斷變化的工作負載模式和需求,進而提供始終如一的快速效能和適當規模。即便向量數量從原型設計期間的數千個猛增至生產環境中的數億個,向量引擎也可以無縫擴展,毋須重新索引或重新載入資料來擴大基礎設施。此外,向量引擎為索引和工作負載搜尋提供了單獨的運算資源,讓用戶可以即時無縫地獲得、更新和刪除向量,同時確保使用者查詢效能絲毫不受影響。所有資料都長久地儲存在Amazon Simple Storage Service(Amazon S3)中,因此用戶可以獲得與Amazon S3相同的資料持久性保證(11個9,即99.999999999%)。儘管目前還處於預覽階段,但向量引擎是為生產環境工作負載設計的,具有因應可用區(Availability Zone)服務中斷和基礎設施故障的餘裕機制。Amazon OpenSearch Serverless向量引擎由開源OpenSearch專案中的k近鄰(kNN)搜尋功能提供支援,該功能能夠提供可靠而精確的結果。如今,許多客戶在託管集群中使用OpenSearch kNN搜尋,以便在應用程式中提供語義搜尋和個人化推薦。向量引擎的使用者體驗與Serverless環境一樣簡單易用。向量引擎支援歐氏距離、餘弦相似度和內積等常用的距離指標,可容納16,000個維度,因此非常適合支援各種基礎模型及其他AI/ML模型。使用者還可以儲存各種資料的不同欄位,例如詮釋資料中的數位、布林值、日期、關鍵字和地理位置,以及包含描述性資訊的文本等,來為儲存的向量添加更多上下文資訊。多種類型資料的合併能降低複雜性,提升可維護性,並且避免資料重複、版本相容性挑戰和授權問題,有效地簡化應用程式棧。向量引擎支援相同的OpenSearch開源套件API,讓用戶可以充分利用其豐富的查詢功能,例如全文檢索搜尋、進階篩選、聚合、地理空間查詢、巢狀查詢,以加快資料檢索和增強搜尋結果。以要求查找距離用戶15英里以內的結果的應用為例,向量引擎可以在單個查詢中完成這項任務,而不需要維護兩個不同系統,並利用應用邏輯將結果合併。透過整合LangChain、Amazon Bedrock和Amazon SageMaker,用戶可以輕鬆地將偏好的機器學習和AI系統與向量引擎整合。
向量引擎支援不同領域的廣泛應用,包括圖像搜尋、文檔搜尋、音樂檢索、產品推薦、影片搜尋、基於位置的搜尋、詐騙偵測以及異常偵測。AWS預測,將詞彙搜尋方法與先進的機器學習和生成式AI功能結合的混合搜尋將會日益流行。例如,當使用者在電子商務網站上搜尋「紅色襯衫」時,語義搜尋透過檢索所有紅色來擴大搜尋範圍,同時在詞法(BM25演算法)搜尋上調整和強化邏輯。利用Amazon OpenSearch篩選功能,企業可以為用戶提供基於尺寸、品牌、價格範圍和附近商店存貨狀況等資訊來優化搜尋選項,進一步強化搜尋結果的關聯性,以便打造更個人化、更精準的體驗。向量引擎支援的混合搜尋使得用戶能夠在單個查詢調用中查詢向量嵌入、詮釋資料和描述性資訊,進而在不建立複雜應用程式碼的情況下,輕鬆地提供更準確的、與上下文相關的搜尋結果。
從預覽到正式可用
AWS近日宣布推出向量引擎的預覽版,用戶可以立即開始試用。在向量引擎正式可用之前,AWS計畫推出兩項功能來降低客戶首個集合的成本。第一項功能是新的開發-測試(dev-test)選項,它能讓使用者在沒有備份或副本的情況下啟動集合,進而將入門成本降低50%。向量引擎仍然提供持久性保證,因為它將所有資料保存在Amazon S3中。第二項功能是在初始階段配置0.5 OCU(OpenSearch計算單位)資源,資源將根據使用者的實際工作負載來擴展;如果初始工作負載的規模是數萬到數十萬個向量(取決於維度數量),用戶則可以進一步降低成本。除了這兩項功能外,AWS將把支援使用者首個集合所需的最低OCU從每小時4個降至每小時1個。
AWS還在開發一些新功能,在未來幾個月,將會實現工作負載暫停與恢復能力,這項新功能對向量引擎十分有用,因為許多應用不需要持續索引資料。
最後,AWS持續致力於優化向量圖的效能和記憶體使用,包括改進快取和合併等功能。
在AWS致力於降低用戶成本的同時,AWS將提供1400 OCU小時/每月的免費向量集合,直到開發-測試選項宣布可用為止。
Amazon OpenSearch Serverless向量引擎預覽版現已在全球八個Region可用:美國東部(俄亥俄州)、美國東部(維吉尼亞州北部)、美國西部(奧勒岡州)、亞太地區(新加坡)、亞太地區(雪梨)、亞太地區(東京)、歐洲(法蘭克福)和歐洲(愛爾蘭)。
→更多的【PCDIY!業界新聞】: 請見
→更多的【PCDIY!賣場情報】: 請見
→更多的【PCDIY!科技情報】: 請見
→更多的【IT資訊新聞】: 請見
→更多的【ITMan!資訊經理人】: 請見
→更多的【PCDIY!八卦】: 請見
延伸閱讀
(01)光華商場的新危機,淘寶網帶來的跨境電商價格戰!(02)48顆壞25顆》威騰WD RE 3TB硬碟驚爆鬧機瘟,WD3000FYYZ死機地雷硬碟故障率高到嚇人!
(03)高雄建國電腦商圈爆倒店潮,引爆網友熱議!
(04)Seagate硬碟廣告:我也不想當死雞隊友啊,引爆玩家熱議!
(05)PTT寫手門事件:電蝦板主發表不自殺聲明,引爆網友熱議!
(06)記憶體插上16GB有多爽,引爆網友熱議!
(07)英特爾Intel 10GbE網路卡X540T2,淘寶網水貨價格殺很大!
(08)SSD爆發連環關門潮,憶正Memoright驚傳財務危機疑似倒閉!
(09)幫組電腦到自己貼錢的經驗,引爆網友熱議!
(10)教授認證防毒軟體「360安全衛士」,引爆網友熱議!
(11)DDR4記憶體金手指歪掉惹,引爆網友熱議!
(12)原價屋的商業模式,引爆網友熱議!
(13)Intel CPU神保固,舊換新大升級引爆網友狂推聯強貨!
(14)日本寬頻網路10G光纖上網,引爆網友熱議!
(15)Windows XP再戰十年,引爆網友熱議!
(16)光華商場的下一步,全世界都在看!
(17)東芝TOSHIBA Harrier MG03ACA300 3TB企業級硬碟,中國水貨價格殺很大!
(18)洋垃圾神器,Xeon E5-2670實測開箱大作戰!
(19)硬碟故障資料救援,等了一年八個月...
(20)新一代玩家聖物,6700元買16核心32執行緒Xeon E5-2675 v3處理器!
(21)淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
(22)洋垃圾戰神,5999元買14核心28執行緒Xeon E5-2683v3神器級處理器!
(23)硬碟用SSD有多爽,引爆網友熱議!
(24)磁碟陣列要選RAID 5還是RAID 6 引爆網友熱議!
(25)電腦CPU沒三萬沒法玩這遊戲,引爆網友熱議!
(26)為什麼有人要推AMD CPU菜單,引爆網友熱議!
(27)200TB資料怎麼儲存,引爆網友熱議!
(28)硬碟故障資料救援報價3萬8 引爆網友熱議!
(29)NVIDIA顯示卡的品牌怎麼挑選 引爆網友熱議!
(30)高科技竹筷,對付笨重顯示卡的神兵利器!
(31)電腦機殼價格破萬 引爆網友熱議!
(32)be quiet!電源供應器爆假貨,引爆了鍵盤大戰!

- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 摺 才叫帥!Motorola razr 60系列攜Pantone 潮色登場 時尚摺疊OG始祖Motorola x 嘻哈OG男神 瘦子 E.SO 科技與經典時尚盡在motorola razr 60|60 ULTRA
- 專家全方位剖析 AI 2.0 產業生態系與企業AI中心佈建關鍵 AI NEXT FORUM將於5月6日登場 多家科技大廠現場展示企業AI創新解方
- 曜越推出ATX 3.1金牌認證電源 鋼影TOUGHPOWER GT 1000W/1200W
- InnoVEX 450家新創齊聚 引領全球創新浪潮
- Sony 發表 E 接環 FE50-150mm F2 GM 鏡頭 全球首款達150mm F2
- 工控資安再升級!華碩智慧物聯網榮獲IEC 62443-4-1認證
- 再造進化!華碩、ROG創新出擊COMPUTEX 2025
- 網石歡慶《我獨自升級: ARISE》上市1周年 大規模更新與活動即將登場
- 微軟發佈《2025 工作趨勢指數》報告 揭示「AI 前瞻企業」興起 超過 8 成台灣企業預計於未來 18 個月內導入 Agents Microsoft 365 Copilot 強勢更新 強化下一代 AI 人機協作體驗
- 強力貫穿、寂靜高效,NZXT 全新世代 靜音扇/靜壓扇,水冷/塔散/機殼完全適配,滿足穿透與寧靜的風流渴望!
- Acer Nitro VG240Y P6 電競螢幕 144Hz高刷新升級上市
- Oen應援科技客戶數年增340% 全面推動「應援經濟」發展 A輪募資進度已達70% 將聚焦於雲端金流技術升級與跨市場應用擴展
最多人點閱
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- 超車Intel最強Xeon Platinum 8380處理器2.8倍性能!AMD第四代EPYC 9004系列正式登場,引進12通道DDR5-4800記憶體、PCIe 5.0、CXL記憶體與最高96核心192執行緒戰鬥力,霄龍EPYC 9654榮登伺服器處理器世界之王!
- 散熱頂天!「華碩 GeForce RTX 50 全系列顯示卡」勁勢登場,「ROG、TUF Gaming、Prime」系列5070、5070 Ti、5080與5090顯示卡接力上市!
- 微軟與精益科技推出 Office 365 加值服務 「Plustek雲端智慧掃描器」 掃描文件即上雲端
- 振華 SUPER FLOWER 推出雙白金、全模組、專利九宮格任意插「全新 LEADEX VII Platinum PRO ATX 3.1電源供應器」,給你自由擴充的未來!
- 英特爾推出全新Xeon W-2400、W-3400工作站處理器-專業人士的絕佳解決方案!
- 王者堆料!技嘉科技發表「GeForce RTX 50系列顯示卡」,正式發售「AORUS系列XTREME WATERFORCE、MASTER與GIGABYTE系列GAMING,AERO、WINDFORCE」系列GeForce RTX 5080、5090顯示卡!
- 喬思伯 Jonsbo 全新TK系列 成員「TK-0」正式登場!胡桃實木鋁合金,直立橫躺小海景機殼!
- 超微Zen4伺服器EPYC處理器來襲!AMD將在2022年11月10日透過“together we advance_data centers”線上發表會,發佈通用運算Genoa、雲原生運算Bergamo、通用運算加強版Genoa-X與邊緣運算Siena新一代全新EPYC處理器!
- 創見推出專業級DrivePro Body 70穿戴式攝影機, 安全守護警消醫護人員執勤首選!
- TP-Link台灣針對市場引導性報導回應:「TP-Link台灣所販售的產品均符合當地相關法律規範及資安要求。我們將持續秉持高標準,履行在安全與創新方面的承諾,為全球用戶提供值得信賴的網路解決方案!」
- 史上最強ARM伺服器報到!技嘉科技推出2路256核心Ampere Altra Max處理器伺服器,節能強效滿足雲端資料中心應用需求!
