PCDIY!業界新聞
NVIDIA Research 透過有限的資料集實現人工智慧訓練上的突破,資料增強技術讓 AI 模型能夠使用大都會藝術博物館的一個小資料集模擬藝術品,並在醫療等領域中開創新的潛在應用範圍
(本資訊由廠商提供,不代表PCDIY!立場) 2020-12-09 12:56:45NVIDIA 的研究人員把開創性的神經網路訓練技術用於熱門的 NVIDIA StyleGAN2 模型上,以大都會藝術博物館所提供不到 1,500 張圖片這麼小的資料集,用新的角度去審視藝術品。
NVIDIA Research 的最新人工智慧 (AI) 模型,簡直就是生成對抗網路界中的奇才。它只要使用一般生成對抗網路 (GAN) 所需學習材料的一小部分,就能學習到像是模仿著名畫家的畫風,以及重現癌症組織影像這般複雜的技能。
NVIDIA 的研究人員把開創性的神經網路訓練技術用於熱門的 NVIDIA StyleGAN2 模型上,以大都會藝術博物館所提供不到 1,500 張圖片這麼小的資料集,用新的角度去審視藝術品。他們用 NVIDIA DGX 系統來加快訓練速度,取材自歷史人物肖像,創造出新的 AI 藝術。
這項稱為自我調整判別器增強 (adaptive discriminator augmentation; ADA) 的技術,將訓練所需的影像數量減少了 10 到 20 倍,卻依舊能獲得良好的訓練成果。同樣的方法有朝一日可能會對醫療領域產生重大影響,像是建立癌症組織學影像來協助訓練其它的 AI 模型。
NVIDIA 繪圖研究部門副總裁 David Luebke 表示:「這些結果代表人們可以使用生成對抗網路來解決問題,這些問題不是得耗費大量時間來取得海量資料,不然就是難以取得這麼大量的資料。我迫不及待地想看看藝術家、醫學專家和研究人員,會把這項技術用在哪些領域。」
NVIDIA 將於本週在神經信息處理系統年會 (NeurIPS) 上發表這個研究項目背後的研究報告;該大會接受了 28 篇 NVIDIA Research 的研究報告,刷新了過去的紀錄,而本篇報告是其中的一篇。
這項新方法是 NVIDIA 研究人員在生成對抗網路創新傳統中的最新成果,這些研究人員開發出突破性的生成對抗網路模型,像是 AI 繪畫應用程式 GauGAN、遊戲引擎模仿程式 GameGAN 及寵物照片變臉程式 GANimal。這些應用程式可以在 NVIDIA AI Playground 上取得。
訓練資料的困境
生成對抗網路跟大多數神經網路一樣,長期以來始終遵循一個基本原則,也就是訓練資料越多,模型品質越好。原因在於每個生成對抗網路都由兩個合作的網路組成,一個負責建立合成影像的生成器,還有一個根據訓練資料學習逼真影像外觀相似程度的判別器。判別器對生成器進行指導,對它生成的每個像素給予回饋,以協助提高合成影像的真實感。然而可供學習的訓練資料有限,判別器無法幫助生成器徹底發揮其潛力,就像是一個新手教練所經歷過的比賽場次,比經驗豐富的專家少得多。
通常要用上五萬到十萬張影像,才能訓練出一個高品質的生成對抗網路。但在多數情況下,研究人員手邊根本沒有幾萬或幾十萬張樣本影像可供使用。
如果只用幾千張影像來進行訓練,許多生成對抗網路會無法產生出極具逼真感的影像。判別器只是單純記住訓練影像,無法提供有用的回饋給生成器時,就會出現這個稱為過度擬合 (overfitting) 的問題。
研究人員在影像分類的任務中,以資料增強技術來解決過度擬合的問題,而資料增強技術以旋轉、裁剪或翻轉等過程來隨機扭曲影像,為現有影像建立副本以擴大規模較小的資料集,迫使模型擁有更佳的歸納概括能力。
過去嘗試過把增強技術用在生成對抗網路的訓練影像上,造成生成器學會了模仿這些扭曲後的影像,而不是建立具有可信度的合成影像。
身負重任的生成對抗網路
NVIDIA Research 的 ADA 方法能夠以自我調整的方式來增強資料,代表在訓練過程中不同的時間點調整資料增強量,以避免過度擬合。此舉讓 StyleGAN2 這樣的模型就算使用少一個數量級的訓練影像,也能達到同樣驚人的效果。這麼一來研究人員便能把生成對抗網路用在過去不切實際的應用項目裡,會視為不切實際的原因,在於這些應用項目的範例太少、太難取得,或是得耗費大量時間才能蒐集到一個大型資料集。
藝術家們使用不同版本的 StyleGAN 來創作令人驚嘆的展示品,並且按照傳奇插畫家手塚治虫 (Osamu Tezuka) 的風格創作新的漫畫。Adobe 公司還用它來支援 Photoshop 的全新 AI 工具 Neural Filters。
想要入門學習這個模型無需太多訓練資料,帶有 ADA 的 StyleGAN2 可以用於創作稀有的藝術作品,像是來自法國巴黎的 AI 藝術團隊 Obvious 使用生成對抗網路創作出的非洲科塔 (African Kota) 面具作品。
醫療保健是另一個前途大好的應用領域,在多數測試結果皆為正常的情況下,罕見疾病的醫學影像並不多。醫學專家要花上不少時間來一一標註,才能累積出一個有用的異常病理切片資料集。
使用搭配 ADA 的生成對抗網路來建立合成影像,可以解決這個問題,為另一個 AI 模型產生出訓練資料,協助病理學家或放射科醫生在病理影像或 MRI 研究中找出罕見疾病。一個額外的好處是,有了 AI 產生出的資料,就不存在患者資料或隱私的困擾,醫療機構便能更容易共用資料集。
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 網石於 The Game Awards 2025公開 《七大罪:Origin》全新預告片
- 威剛揮出永續全壘打 全面加速ESG行動 厚植永續治理 接連榮獲「台灣企業永續獎」、最佳職場肯定
- 科技海嘯來襲!Check Point Software 發佈 2026 年資安預測 技術融合與 AI Agents 的崛起重新定義全球安全韌性
- NetApp 揭露台灣資料管理策略 驅動台灣躍升區域 AI 樞紐 從統一資料儲存邁向統一資料模型 NetApp 強化資料管理方法 加速企業 AI 資料管道 助攻台灣 AI 島願景
- HPE 推出首款 AMD「Helios」AI機架級解決方案 整合Broadcom開放式網路架構,加速AI部署
- TrendForce: 傳統旺季與新品帶動,3Q25全球智慧手機產量季增9%
- XPG 發表全新 ARMAX DDR5 系列電競記憶體 隱形戰機造型設計 助玩家馳騁無數遊戲戰役
- 混合專家架構驅動最智慧的前沿 AI 模型, 搭載 NVIDIA Blackwell NVL72 運行速度提升達十倍
- 十銓科技發表 TEAMGROUP PD40 迷你外接式固態硬碟 輕巧之姿融合高速效能 隨行儲存引領行動新潮
- 華碩智慧指揮中樞亮相 2025 醫療科技展 大秀人機協作新紀元
- 點亮文青桌面美學!ASUS Jelly75撞色鍵盤玩出新氣氛
- AMD與HPE擴大合作,攜手推進開放式機架級AI基礎設施
最多人點閱
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- IEM於台北國際電玩展熱血開打,購買Intel Core i5/i7處理器系列+SSD 750即得限量好禮
- AMD發表全球首款GPU硬體虛擬化產品線
- 希捷科技:2016年六大科技趨勢
- InWin 805 NVIDIA EDITION機殼爆紅,迎廣GeForce GTX特仕版機箱正式開賣!
- 2024開學季筆電選購指南: 10大熱銷筆電推薦榜
- Windows 10 搭載 Office 版本聲明稿 Office Mobile 、 Office 2016 與 Office 365 版本差異說明
- Lenovo聯想持續拓展伺服器市場,瞄準中型企業推出ThinkServer系列伺服器
- 你的人生「升級」了沒?倒數十天!Windows 10開闊你的無限視野
- 全新Intel Core X系列處理器- Intel Core i9 極致版處理器 重裝上陣
- 微軟攜手研華、凌華與新漢 以Azure IoT Suite串聯物聯網大未來
- PLEXTOR展現軟實力,一舉推出三大獨家軟體
