PCDIY!業界新聞
NVIDIA Research 透過有限的資料集實現人工智慧訓練上的突破,資料增強技術讓 AI 模型能夠使用大都會藝術博物館的一個小資料集模擬藝術品,並在醫療等領域中開創新的潛在應用範圍
(本資訊由廠商提供,不代表PCDIY!立場) 2020-12-09 12:56:45NVIDIA 的研究人員把開創性的神經網路訓練技術用於熱門的 NVIDIA StyleGAN2 模型上,以大都會藝術博物館所提供不到 1,500 張圖片這麼小的資料集,用新的角度去審視藝術品。
NVIDIA Research 的最新人工智慧 (AI) 模型,簡直就是生成對抗網路界中的奇才。它只要使用一般生成對抗網路 (GAN) 所需學習材料的一小部分,就能學習到像是模仿著名畫家的畫風,以及重現癌症組織影像這般複雜的技能。
NVIDIA 的研究人員把開創性的神經網路訓練技術用於熱門的 NVIDIA StyleGAN2 模型上,以大都會藝術博物館所提供不到 1,500 張圖片這麼小的資料集,用新的角度去審視藝術品。他們用 NVIDIA DGX 系統來加快訓練速度,取材自歷史人物肖像,創造出新的 AI 藝術。
這項稱為自我調整判別器增強 (adaptive discriminator augmentation; ADA) 的技術,將訓練所需的影像數量減少了 10 到 20 倍,卻依舊能獲得良好的訓練成果。同樣的方法有朝一日可能會對醫療領域產生重大影響,像是建立癌症組織學影像來協助訓練其它的 AI 模型。
NVIDIA 繪圖研究部門副總裁 David Luebke 表示:「這些結果代表人們可以使用生成對抗網路來解決問題,這些問題不是得耗費大量時間來取得海量資料,不然就是難以取得這麼大量的資料。我迫不及待地想看看藝術家、醫學專家和研究人員,會把這項技術用在哪些領域。」
NVIDIA 將於本週在神經信息處理系統年會 (NeurIPS) 上發表這個研究項目背後的研究報告;該大會接受了 28 篇 NVIDIA Research 的研究報告,刷新了過去的紀錄,而本篇報告是其中的一篇。
這項新方法是 NVIDIA 研究人員在生成對抗網路創新傳統中的最新成果,這些研究人員開發出突破性的生成對抗網路模型,像是 AI 繪畫應用程式 GauGAN、遊戲引擎模仿程式 GameGAN 及寵物照片變臉程式 GANimal。這些應用程式可以在 NVIDIA AI Playground 上取得。
訓練資料的困境
生成對抗網路跟大多數神經網路一樣,長期以來始終遵循一個基本原則,也就是訓練資料越多,模型品質越好。原因在於每個生成對抗網路都由兩個合作的網路組成,一個負責建立合成影像的生成器,還有一個根據訓練資料學習逼真影像外觀相似程度的判別器。判別器對生成器進行指導,對它生成的每個像素給予回饋,以協助提高合成影像的真實感。然而可供學習的訓練資料有限,判別器無法幫助生成器徹底發揮其潛力,就像是一個新手教練所經歷過的比賽場次,比經驗豐富的專家少得多。
通常要用上五萬到十萬張影像,才能訓練出一個高品質的生成對抗網路。但在多數情況下,研究人員手邊根本沒有幾萬或幾十萬張樣本影像可供使用。
如果只用幾千張影像來進行訓練,許多生成對抗網路會無法產生出極具逼真感的影像。判別器只是單純記住訓練影像,無法提供有用的回饋給生成器時,就會出現這個稱為過度擬合 (overfitting) 的問題。
研究人員在影像分類的任務中,以資料增強技術來解決過度擬合的問題,而資料增強技術以旋轉、裁剪或翻轉等過程來隨機扭曲影像,為現有影像建立副本以擴大規模較小的資料集,迫使模型擁有更佳的歸納概括能力。
過去嘗試過把增強技術用在生成對抗網路的訓練影像上,造成生成器學會了模仿這些扭曲後的影像,而不是建立具有可信度的合成影像。
身負重任的生成對抗網路
NVIDIA Research 的 ADA 方法能夠以自我調整的方式來增強資料,代表在訓練過程中不同的時間點調整資料增強量,以避免過度擬合。此舉讓 StyleGAN2 這樣的模型就算使用少一個數量級的訓練影像,也能達到同樣驚人的效果。這麼一來研究人員便能把生成對抗網路用在過去不切實際的應用項目裡,會視為不切實際的原因,在於這些應用項目的範例太少、太難取得,或是得耗費大量時間才能蒐集到一個大型資料集。
藝術家們使用不同版本的 StyleGAN 來創作令人驚嘆的展示品,並且按照傳奇插畫家手塚治虫 (Osamu Tezuka) 的風格創作新的漫畫。Adobe 公司還用它來支援 Photoshop 的全新 AI 工具 Neural Filters。
想要入門學習這個模型無需太多訓練資料,帶有 ADA 的 StyleGAN2 可以用於創作稀有的藝術作品,像是來自法國巴黎的 AI 藝術團隊 Obvious 使用生成對抗網路創作出的非洲科塔 (African Kota) 面具作品。
醫療保健是另一個前途大好的應用領域,在多數測試結果皆為正常的情況下,罕見疾病的醫學影像並不多。醫學專家要花上不少時間來一一標註,才能累積出一個有用的異常病理切片資料集。
使用搭配 ADA 的生成對抗網路來建立合成影像,可以解決這個問題,為另一個 AI 模型產生出訓練資料,協助病理學家或放射科醫生在病理影像或 MRI 研究中找出罕見疾病。一個額外的好處是,有了 AI 產生出的資料,就不存在患者資料或隱私的困擾,醫療機構便能更容易共用資料集。
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- Chome明上午10點限量開賣MacBook Air M4、Mac Studio M4 Max/M3 Ultra MacBook Air M4預購首日銷量對比M3成長近一倍!13吋天藍256GB最受果粉喜愛 母親節優惠加碼!Apple旗艦館5/1祭一日限定優惠,滿萬元送3%回饋
- Arm參與COMPUTEX 2025系列活動 分享邁向AI新世代的科技願景
- 宏碁《Aspire 14 AI》筆電上市 輕鬆入手 Copilot+ PC AI 體驗、長效續航、輕巧便攜一次擁有!
- 玩家必收!ROG SLASH 4.0三款「SSS級」潮包攻佔電競時尚
- 我 行 我 速 行動娛樂 由我定義 G403C 4G LTE Cat.4 N300行動路由器 個性登場
- Fortinet 2024年永續發展報告: 跨領域擴大國際合作 實現安全可靠的數位未來
- 摺 才叫帥!Motorola razr 60系列攜Pantone 潮色登場 時尚摺疊OG始祖Motorola x 嘻哈OG男神 瘦子 E.SO 科技與經典時尚盡在motorola razr 60|60 ULTRA
- 專家全方位剖析 AI 2.0 產業生態系與企業AI中心佈建關鍵 AI NEXT FORUM將於5月6日登場 多家科技大廠現場展示企業AI創新解方
- 曜越推出ATX 3.1金牌認證電源 鋼影TOUGHPOWER GT 1000W/1200W
- InnoVEX 450家新創齊聚 引領全球創新浪潮
- Sony 發表 E 接環 FE50-150mm F2 GM 鏡頭 全球首款達150mm F2
- 工控資安再升級!華碩智慧物聯網榮獲IEC 62443-4-1認證
最多人點閱
- Microsoft Azure Certified for IoT 快速打造智慧物聯網
- SP廣穎電通將於德國2015 Embedded World展示全方位工控系列產品
- 英特爾舉辦亞洲區創新高峰會 促進台灣與全亞洲產業體系的創新發展
- IEM於台北國際電玩展熱血開打,購買Intel Core i5/i7處理器系列+SSD 750即得限量好禮
- 深根台灣成就萬物相聯 2015 ARM®新竹辦公室擴大營運暨亞洲第一座CPU設計中心開幕
- AMD發表全球首款GPU硬體虛擬化產品線
- AMD推出全球首款業界領先的32GB記憶體伺服器GPU 瞄準高效能運算
- AMD推出全新Catalyst 15.7驅動程式 讓AMD APU及GPU充分展現Windows®10直覺化體驗
- PLEXTOR感恩節大回饋,M6V卡禮來雙重送!
- 希捷科技:2016年六大科技趨勢
- 台灣微軟攜手台大電機 高中程式夏令營獲佳評
- 台灣微軟與Lamigo聯手 應援總冠軍封王賽「Win for 10」!
