現場直擊專訪

AMD TechDay 2015,超越製程極限的微處理器架構設計

文.圖/陳文欽 2015-06-11 00:00:00
在2015 Computex 前夕,美商超微半導體(AMD) 於5 月27 日上午10 點,於中國北京中關村皇冠酒店舉辦一整天的AMD NDA TechDay 技術日,邀集台灣與大陸兩岸三地共六十多家媒體與會,講解AMD 即將於5 月28 日解禁的旗艦桌上型加速處理器- A10-7870K,以及於6 月4 日發表的第六代架構筆記型APU 微架構、效能與設計理念。

旗艦級桌上型效能APU

2014 年1 月,超微(AMD) 推出接替Bulldozer核心的第二代Steamroller 微處理器架構APU -AMD A10-7850K。A10-7850K 採用Kaveri 核心,也就是由2Core 加1FP 雙核心共同配置/ 共享1 組浮點運算單元的配對模組基礎,以28 奈米SHP 製程所打造;處理器插槽腳位架構為Socket FM2+ (906pins), 使用28 奈米SHP 製程引進,並且首度提供了hUMA(heterogeneous Unified Memory Architecture) 異質核心記憶體統合架構,CPU 與GPU 之間的內容藉由高速L2 快取直接聯繫溝通,而無須透過外部較慢速的記憶體匯流排交換,同時也提供了16 線路(x16)PCIe 3.0 匯流排。而其內建的GPU 核心擁有8 個著色運算管線(8 ROPs)、32 個紋理貼圖單元(32 TMUs)、512 個Unified Shaders 的Radeon R7 繪圖處理器核心,等級略等於GeForce GT640、Radeon R7 250 入門獨立顯示卡。

於北京中關村皇冠酒店舉辦的AMD技術日會場


經過一年多之後, 在2015 Computex 前夕AMD 舉辦了技術日,正式揭露第一波採用研發代號為Godavari(Kaveri-Refresh) 核心的APU,正式型號為A10-7870K,型號後面K 代表不鎖倍頻的可超頻版本。Godavari 核心的A10-7870K 跟一年多A10-7850K 同屬於Steamroller 微處理架構,也同為28 奈米SHP 製程,四核CPU 加八核GPU 架構;內建雙通道DDR3-2133 記憶體匯流排控制器,記憶體頻寬流量達34.1GB/s。A10-7870K 可視為先前Kaveri 核心A10-78xx 系列的終極可超頻版,其預設時脈為3.9GHz,在TurboCore 模式下可超頻至4.1GHz,所內建的GPU 核心同樣為8ROPs、32TMUs、512 Unified Shaders 的Radeon R7 繪圖核心,但時脈頻率調昇20% 來到了866MHz,同時把整體設計熱功率(TDP) 維持在95 瓦。全系列均支援Direct X12(需搭配Windows 10)與Mantle API 加速函式標準,以及支援HSA 異質核心架構與FreeSync 螢幕╱顯卡頻率同步技術。

AMD 在 TechDay 2015 上 展 示 35~15W Carrizo、5~15W Carrizo-L 筆電APU,以及桌上型Godavari APU(A10-7870K)


A10-7870K 處理器推出後, 立刻成為目前AMD 桌上型電腦最頂級規格的APU 產品。一樣採取906pins 的Socket FM2+ 插槽腳位設計,也就是說過去採A55、A75、A78 與A88X 晶片組所設計的Socket FM2+ 主機板,皆能直接升級換裝使用 ( 可能需要下載新版BIOS 韌體)。A10-7870K 直接對手鎖定價位最接近的Intel Core i3-4370 處理器(150 美元) 搭內顯的平台下,據AMD 的測試資料,在3Dmark11 測試中,A10-7870K 領先i3-4370 幅度從109% 到129% 不等;在PCMark 8、BaseMark CL 等負載測試中,A10-7870K 也優於Core i3-4370 的表現,幅度從5% 到85% 不等。

▲excavator挖掘機核心架構的第6代APU(Carrizo),同樣28nm SHP也有近乎20/16nm製程微縮的效能╱功耗水平


即便搭配80 美元的GeForce GT 740 顯卡來比較,在Dota 2、英雄聯盟和星際爭霸Ⅱ ( Star Craft Ⅱ ) 等遊戲下,AMD A10-7870K APU 執行效能、畫面流暢度仍然領先,但整體APU 平台售價只有對手i3-4370+GT740 總和的一半左右,在不玩重度、4K UHD 畫質遊戲、不跑專業繪圖軟體,只是一般上網、製作簡報、執行辦公室軟體,偶而玩線上遊戲的話,算是相當便宜且具備C/P 值的選擇。A10-7870K 報價為美金137 元(折合台幣4247 元),6 月2 日起由OEM 通路開始供貨。

excavator核心架構的APU,在圖形效能上的提昇


第六代Carrizo核心架構初探:以設計工藝超越製程極限

相較於英特爾(Intel)、三星(Samsung) 紛紛在2014 年第四季、2015 年第一季,切入14奈米魚鰭閘極場效電晶體(FinFET) 製程,高通(Qualcomm)、聯發科(MediaTek) 也在2014 年第四季到2015 年上半,透過台積電或其他晶圓代工廠,改採20 奈米HPM 製程技術來產製新一代4到8 核應用處理器。而AMD 受限於其晶圓代工夥伴格羅方德(GlobalFoundries),切換到次世代製程技術上的不順遂,到2015 年底,都還只有28nm製程的超高效能(Super High Performance, SHP) 製程在手,跟競爭對手相差了兩個世代的製程差距。為此,謠傳中的全新Zen 架構這張牌,只能按耐到2016 年,看看接受三星策略聯盟合作( 輔導)的GlobalFoundries,能否在2016 年順利搭上14奈米製程量產列車。而從2014 年下半傳聞的Plan B 救援方案,也就是傳聞中的Excavator( 挖掘機) 核心(它仍就是從過去28nm 製程時代就沿用的Steamroller( 壓路機) 架構),以雙核心共享1 組浮點運算單元的2Core 加1FP 配對模組為基礎,每個Core 依然是所謂的4way Issue/SuperScalar( 四線路x86 指令解碼╱發送架構) ,但是將L1 Cache 快取記憶體加倍、位址轉譯緩衝區(Address Translation Cache,ATC) 項目的增加( 從512 增加到768),以及追加512bit SIMD-FP 的AVX2、MOVBE、SMEP、BMI1/2 指令集。

以第6代APU(Carrizo)瞄準400-700美元筆電


只是光這樣,怎麼能夠弭平跟超級強敵(Intel)近乎兩代(28nm vs 14nm) 的製程技術鴻溝呢?為達成AMD 25x20 效能提昇計畫,也就是在2020 年底之前,將目前APU 效能提昇25 倍的遠大目標。針對筆記型電腦市場,AMD 從2011 年的第一代Liano、2012 年第二代Trinity、2013 年第三代Kabini、2014 年第四代Kaveri 與第五代Beema 核心架構之後,在今年(2015)2 月國際固態電路會議(ISSCC) 中,AMD 院士暨設計師KathyWilcox 在一場專為效能與使用面積優化的28nm製程x86 核心APU 演講中,首度揭露了Excavator核心,將採取超高密度線路設計庫(High-Density Labrary, HDL),並打破過去由CPU 為核心的電路佈局設計,再參酌GPU、SoC 等分散、分層式推疊設計觀念,從過去的9 道金屬連結層,增加到近17道金屬連接層,重新進行整個APU 電路的繪製與優化。

AMD 技術日當天,AMD 進一步揭露了採取新一代Excavator 處理器核心設計下,微架構上的種種改進。AMD 先分析了全局電路的半導體╱電晶體屬性,然後選擇了佔用最大比例的中速率、中等洩漏電流量的半導體製程參數的配置,使APU 一開始就不使用過量的超額工作電壓並使用全局打散、專屬電源供應的Radeon GCN GPU 核心電路設計。經過2,000 多名IC 設計╱製程等工程師的努力下,率先導入Excavator 核心的筆電APU(核心代號為Carrizo),FPU 浮點運算電路縮減38%,FMAC 浮點乘加器與指令快取(I-Cache) 均縮減35% 面積,達成相同製程下矽晶電路面積微縮23%,等於在上一代Kaveri APU 相同矽晶圓面積下,多擠了29% 的電晶體。

AMD第6代APU提供更強悍的圖形╱視訊解壓縮效能與長效供電


Excavator 導入同Radeon 8000 系列等級的GCN 繪圖核心架構,將GPU L2 Cache 加大到512KB,尖峰浮點運算效能高達819GFLOPS;還具備第六代Unified Video Decoder(UVD6),提供HEVC (H.265) 硬體解壓縮加速性,同時藉由異質性核心架構的排序優化機制(HSA QoS),CPU 與GPU以100% 全頻率全速、全雙工(FullDuplex) 方式共享L2 快取以及記憶體匯流排的設計;同樣的藉由CPU/GPU 打散於各連接層的電壓調控,以及整合南橋控制晶片於一體。達成Kaveri APU 整體功耗下降30%,而Carrizo 整體平台的功耗,可從過去的9.5W 降到僅4.7W。據AMD 的資料, 鎖定15W 熱功率門檻下,Excavator 核心在工作頻率提昇了39%,在增加L1 Cache、ATC 項目下,每週期指令執行數(Instructions Per Cycle, IPC) 提昇9% 到13%, 同時不增加額外功耗,整體來說,在相同28 奈米SHP 製程中,Excavator 核心技術下的Carrizo,比Steamroller 的Kaveri/Beema APU,最高效能提昇程度多達55%;圖形效能方面,在3D Marks 11 評分部份,較上一代提昇最多達65%。以Excavator 核心技術設計的Carrizo, 以及隨後出現的超低功耗Carrizo-L APU,依所搭配的圖形核心技術與熱功率設計(10/15W、17W、20W/35W), 而分有E1、E2、A4、A6、A8 與頂級A10 處理器, 以1/2/4 核及DDR3L-1333/1666MHz、DDR3-1600/1866MHz 雙通道記憶體控制器的區別等,直接目標就是Intel 第五代Core i(Broadwell) 處理器。

AMD A10-7870K桌上型處理器家族


第六代Carrizo核心APU筆電搶先現身

依IDC調研預測,2015年全球PC市場中,400到700美元價格區段的筆記型電腦,將佔全部PC總出貨量、NB出貨量比重的24、38%;當筆電成為數位家庭中最多才多藝的計算工具,提供收發信件、瀏覽網路、聆聽音樂、內容創造、遊戲、網路串流視訊、影音照片管理及視訊交談等功能,這些都需要越來越多計算能力高的CPU,以及繪圖處理能力強的GPU。AMD針對400-700美元價位的筆電,提供流暢線上遊戲、頂尖串流視訊與創新計算體驗,同時導入四項創新架構-HSA 1.0異質核心加速架構、能普及於主流筆電的HEVC (H.265)硬體解碼線路技術、搭配ARM TrustZone的安全防護技術,以及業界一級的APU SoC設計,來達成比第一代核心達17倍的效能提昇、較上一代核心2倍電池續航時間,APU搭獨顯GPU再提昇42%效能,以及較競爭對手Core i7兩倍以上的1080p圖形效能。據AMD測試資料,配置第六代Carrizo核心的A8-8600P、A10-8700P與AFX 8800P,在15W熱功率設計的輕薄筆電中,3D Mark11評分超越Core i3-5010u、i5-5200u、i7-5500u從34~50%不等,英雄聯盟(League Legends)的畫面速率評測,A10-8700P還優於35W熱功率設計的A8-3500M APU;在Full HD畫面解析度執行DOTA2遊戲,同為35W熱功率設計的AMD FX-8800P,畫面產生速率是上一代A8-3500M的兩倍以上。

藉由AMD所開發的Radeon Dual Graphics技術-由APU內建GPU,與筆記型電腦獨顯GPU晶片協力運作下,像DIRT RALLY(越野菁英賽)、STAR CRAFTⅡ(星海爭霸Ⅱ)等遊戲在FullHD解析度下,遊戲效能還能提昇30~42%;而內建HEVC(H.265)硬體解壓縮引擎的第6代APU,跟未建任何HEVC硬解線路的競爭對手筆電,以4K UHD(3840x2160)@60FPS進行4K解析度畫面播放下,配置第6代APU的筆電可連續播放長達5小時(300分鐘),遠勝過競爭對手筆電的112分鐘供電時間(不到2小時)。

配置AMD第6代APU(FX8800P)筆電下進行4K HEVC(H.265)解碼播放情形


即便進行H.264視訊編碼下,配置硬體解壓引擎(VCE)的第六代APU SoC筆電,將10Mbps的1080p視訊再壓縮編碼到串流速率僅5Mbps,AMD FX-8800P的H.264編碼效能,較上一代AMD FX APU提昇了五倍,也比Core i5-5200u筆電的編碼速度快了四倍。若是同樣以50Wh電池的筆電,進行不插電連續播放H.264影片測試,第六代APU筆電可連續播放長達8.3小時,比上一代APU筆電的3.3小時,電池續航時間延長了2.5倍。AMD 第六代APU也具備Perfect Picture HD技術,在4K UHD顯示器顯示原始圖像╱視訊資料僅Full HD等級時,能進行畫面補點、色彩增豔等即時運算,將圖片╱視訊畫質提升到準4K UHD等級。

在會場上,AMD也展示幾部配置第六代Carrizo核心APU的筆電,不過筆電的廠牌與型號不明(應該是OEM/ODM廠幫OBM品牌廠進行設計階段),我們發現以騰訊HEVC軟體,進行4K UHD視訊的解碼播放下,CPU利用率(CPU Utilization)約在7~8%之間,在執行一段時間後會偶而跳到30%(這是因為筆電CPU進入節電模式時頻率下降到一定程度以下,相對CPU利用率增加了);現場人員還測試過同時開兩個4K UHD視訊來播放,此時CPU利用率超過30%開始顯得吃力了,同時出現掉格延遲的情形。

AMD 也開發像是運用到APU內建GPU或獨顯GPU晶片,搭配筆記型電腦螢幕上方的攝影機╱感測器,藉由不斷的攝影與擷取動作,在無須配備觸控螢幕、接近感測器(Proxy Sensor)的情況下,也能透過手勢動作操控的Gesture Control技術,以及Face Login臉部辨識╱登入等技術。另外也提供了可以開啟Wireless Display無線影音畫面傳輸技術,透過WiFi 802.11n/802.11ac無線網路,來即時傳輸Full HD甚至4K UHD的螢幕╱影音畫面。估計在六月Computex會場上,會有多款OBM品牌商展示以Carrizo APU所設計的超輕薄╱主流筆電。另外AMD也預定發表三款僅4/4.5/8W的A10 Micro- 6700T、A4 Micro-6400T、E1 Micro-6200T處理器,這就是所謂的Carrizo-L低功耗核心,可能會以縮減GCN的ROPs著色運算管線數來降低功耗。

但是面對英特爾14nm製程的Core M、第五代Core i3/5/7-5xxx系列全員到齊,雖然AMD很努力的以電路優化設計,來拉近IC製程與摩爾定律的世代鴻溝,但爭取到的時間並不會太久,長遠來看,AMD仍須督促其協力晶圓廠格羅方德加速14nmFinFET的製程與良率進程,同時輔以傳聞中提昇40% IPC的新一代Zen微核心架構下,才會有繼續在x86市場上,與Intel持續纏鬥爭戰的本錢。




發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。

最近新增