PCDIY!業界新聞
NVIDIA Research 透過人工智慧,在一瞬間將 2D 平面照片變成 3D 立體場景
(本資訊由廠商提供,不代表PCDIY!立場) 2022-04-01 11:42:04
當人們在 75 年前使用寶麗來 (Polaroid ) 相機拍攝出世界上第一張即時成像照片時,便是一項以逼真 2D 影像迅速捕捉 3D 世界畫面的創舉。時至今日,人工智慧 (AI) 研究人員反將此作法倒轉過來,亦即在幾秒鐘內將一組靜態影像變成數位 3D 場景。
這項稱為逆向渲染 (inverse rendering) 的過程,利用 AI 來預估光線在真實世界中的表現,讓研究人員能利用從不同角度拍攝的少量 2D 影像來重建 3D 場景。NVIDIA Research 團隊開發出一種方法,幾乎能在瞬間內完成這項任務,是同類中首批將超高速神經網路訓練與快速渲染相結合的模型之一。
NVIDIA 將該方法應用在一種稱為神經輻射場 (Neural Radiance Fields;NeRF) 的熱門新技術上,創造出 Instant NeRF 這項當今渲染速度最快的 NeRF 技術,在某些情況下速度可以提升超過 1,000 倍。用數十張靜態照片,便能在幾秒鐘內完成訓練模型,再加上拍攝角度的資料,在幾十毫秒內即可渲染出生成的 3D 場景。
NVIDIA 繪圖研究部門副總裁 David Luebke 表示:「如果說多邊形網格這樣的傳統 3D 表現方式像是向量圖形,那麼 NeRF 就像是點陣圖,它們會密集捕捉光線從物體或場景中輻射出來的方式。從這個意義上來說,Instant NeRF 對 3D 的重要性,不亞於數位相機和 JPEG 壓縮技術對 2D 攝影的重要性,其可大幅提升 3D 捕捉與分享的速度、便利性和範圍。」
在 NVIDIA GTC 大會議程中展示的 Instant NeRF,可用於為虛擬世界建立化身或場景、以 3D 方式拍攝視訊會議的與會者以及所處環境,或是為 3D 數位地圖重建場景。
NVIDIA Research 團隊為了向早期的寶麗來照片致敬,重現了安迪.沃荷 (Andy Warhol) 拍攝即時成像照片的經典照片,利用 Instant NeRF 將其轉變為 3D 場景。
收集資料再投入 NeRF 的做法,有點類似紅毯上的攝影師試著從各個角度拍攝名人身上的華麗服裝,而神經網路需要有從場景四周多個位置拍攝的數十張照片,以及每張照片的相機位置等資料支援。
場景裡的人或物體若移動,拍攝照片的速度則是愈快愈好。要是在拍攝 2D 影像的過程中,人或物體有過多的移動,AI 便會生成模糊的 3D 場景。
基本上,NeRF 在此時會填補空白處,訓練一個小型神經網路,預測從 3D 空間中任何一點朝著任意方向輻射出的光線顏色來重建場景。這項技術甚至能解決當某些照片裡的物體被其它照片中的柱子等障礙物遮住時所產生的遮擋問題。
根據畫面的複雜性和解析度,以傳統方法建立一個 3D 場景須花費數小時甚至更長的時間。而利用 AI 則可加快處理速度。早期開發的 NeRF 模型在幾分鐘內便能渲染出無偽影的清晰場景,但仍需數小時進行訓練。
然而,Instant NeRF 卻大幅縮短了渲染時間,其以 NVIDIA 所開發出的 Multi-resolution Hash Encoding 技術為基礎,而這項經過最佳化調整的技術可以在 NVIDIA GPU 上高效運行。研究人員透過一種新的輸入編碼法,可以利用一個高速運行的微型神經網路來創造高品質的結果。
研究人員使用 NVIDIA CUDA 工具套件與 Tiny CUDA 神經網路函式庫來開發此模型。這個小巧的神經網路可以在單一 NVIDIA GPU 上進行訓練和運行,並在搭載 NVIDIA Tensor 核心的顯示卡上有著最高的運行速度。
這項技術可以用於拍攝實體環境物體的 2D 照片或影片,以訓練機器人和自動駕駛車來瞭解這些物體的大小及形狀。建築業與娛樂產業也能使用這項技術,快速為實體環境建立數位畫面,創作者便能用它來進行修改和構建。
除了 NeRF,NVIDIA 的研究人員也在探索如何將這種輸入編碼技術用於加速處理多項 AI 領域的難題,包括強化學習、語言翻譯和通用的深度學習演算法。
這項稱為逆向渲染 (inverse rendering) 的過程,利用 AI 來預估光線在真實世界中的表現,讓研究人員能利用從不同角度拍攝的少量 2D 影像來重建 3D 場景。NVIDIA Research 團隊開發出一種方法,幾乎能在瞬間內完成這項任務,是同類中首批將超高速神經網路訓練與快速渲染相結合的模型之一。
NVIDIA 將該方法應用在一種稱為神經輻射場 (Neural Radiance Fields;NeRF) 的熱門新技術上,創造出 Instant NeRF 這項當今渲染速度最快的 NeRF 技術,在某些情況下速度可以提升超過 1,000 倍。用數十張靜態照片,便能在幾秒鐘內完成訓練模型,再加上拍攝角度的資料,在幾十毫秒內即可渲染出生成的 3D 場景。
NVIDIA 繪圖研究部門副總裁 David Luebke 表示:「如果說多邊形網格這樣的傳統 3D 表現方式像是向量圖形,那麼 NeRF 就像是點陣圖,它們會密集捕捉光線從物體或場景中輻射出來的方式。從這個意義上來說,Instant NeRF 對 3D 的重要性,不亞於數位相機和 JPEG 壓縮技術對 2D 攝影的重要性,其可大幅提升 3D 捕捉與分享的速度、便利性和範圍。」
在 NVIDIA GTC 大會議程中展示的 Instant NeRF,可用於為虛擬世界建立化身或場景、以 3D 方式拍攝視訊會議的與會者以及所處環境,或是為 3D 數位地圖重建場景。
NVIDIA Research 團隊為了向早期的寶麗來照片致敬,重現了安迪.沃荷 (Andy Warhol) 拍攝即時成像照片的經典照片,利用 Instant NeRF 將其轉變為 3D 場景。
NeRF 是什麼?
NeRF 會依照輸入的一組 2D 影像,使用神經網路來表現及渲染逼真的 3D 場景。收集資料再投入 NeRF 的做法,有點類似紅毯上的攝影師試著從各個角度拍攝名人身上的華麗服裝,而神經網路需要有從場景四周多個位置拍攝的數十張照片,以及每張照片的相機位置等資料支援。
場景裡的人或物體若移動,拍攝照片的速度則是愈快愈好。要是在拍攝 2D 影像的過程中,人或物體有過多的移動,AI 便會生成模糊的 3D 場景。
基本上,NeRF 在此時會填補空白處,訓練一個小型神經網路,預測從 3D 空間中任何一點朝著任意方向輻射出的光線顏色來重建場景。這項技術甚至能解決當某些照片裡的物體被其它照片中的柱子等障礙物遮住時所產生的遮擋問題。
利用 Instant NeRF 將渲染速度提升 1,000 倍
人類天生就會按照一部分所見畫面來估算物體的深度和外觀,但這對 AI 來說卻是一項高難度的任務。根據畫面的複雜性和解析度,以傳統方法建立一個 3D 場景須花費數小時甚至更長的時間。而利用 AI 則可加快處理速度。早期開發的 NeRF 模型在幾分鐘內便能渲染出無偽影的清晰場景,但仍需數小時進行訓練。
然而,Instant NeRF 卻大幅縮短了渲染時間,其以 NVIDIA 所開發出的 Multi-resolution Hash Encoding 技術為基礎,而這項經過最佳化調整的技術可以在 NVIDIA GPU 上高效運行。研究人員透過一種新的輸入編碼法,可以利用一個高速運行的微型神經網路來創造高品質的結果。
研究人員使用 NVIDIA CUDA 工具套件與 Tiny CUDA 神經網路函式庫來開發此模型。這個小巧的神經網路可以在單一 NVIDIA GPU 上進行訓練和運行,並在搭載 NVIDIA Tensor 核心的顯示卡上有著最高的運行速度。
這項技術可以用於拍攝實體環境物體的 2D 照片或影片,以訓練機器人和自動駕駛車來瞭解這些物體的大小及形狀。建築業與娛樂產業也能使用這項技術,快速為實體環境建立數位畫面,創作者便能用它來進行修改和構建。
除了 NeRF,NVIDIA 的研究人員也在探索如何將這種輸入編碼技術用於加速處理多項 AI 領域的難題,包括強化學習、語言翻譯和通用的深度學習演算法。
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 芝奇宣布 2026 世界盃超頻大賽正式登場,賽事總獎金高達 40,000 美金!
- 2026年2月11日 2026 MSI春季健檢開跑 六大產品線享十大免費健檢服務項目 再抽品牌精美周邊和QD-OLED電競螢幕
- TrendForce: 記憶體漲勢加劇終端售價壓力,2026年全球手機產量恐面臨顯著衰退風險
- 技嘉攜手 NVIDIA 推出《Resident Evil Requiem》遊戲套裝 強化沉浸遊戲體驗
- 買技嘉/AORUS精選產品《人中之龍 極3 / 人中之龍3外傳 Dark Ties》免費送
- 技嘉攜手 AMD 推出《Crimson Desert》遊戲套裝 全面升級極致遊戲體驗
- 華碩舉辦「商用解決方案交流會」,吸引超過百家ISV軟體服務夥伴
- 快搶!TUF Gaming《黑色行動7》特別版顯示卡超限量上市
- 首跨科普漫畫力作 《 ROG OMNI 無懼特攻 》電競信仰力爆棚
- 宏正榮獲TIPS A級驗證 深化專利治理展現永續韌性
- 「TRYX STAGE 創氪星系 影域」破框而出的視覺革命,「L 型立體微縮劇場」重塑空間的維度與邊界,實現 TDP:280W 解熱能力!
- NetApp 資料平台強力應援第 60 屆超級盃足球賽 智慧型資料基礎架構全面升級利惠體育場的觀賽體驗
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
- JEDEC發布全新DDR5標準規範,從DDR5-4800起跳! 將加速導入下世代高效能電腦系統
- 不再是Toshiba品牌,全新Dynabook 2019 新品發布,透過運算與服務改變世界
- Mac 版 Office 2016 正式在台上市!
- microSD技術邁入第十年,SanDisk microSD記憶卡出貨量突破20億片
- 英特爾前進3D NAND,發表Intel SSD 600p、6000p、E 5420s、E 6000p、DC P3520、DC S3520固態硬碟!
