焦點
優化處理效率就是效能提升的秘密,Intel 解釋Alder Lake大、小核心的架構設計
文.圖/Lucky 2021-08-20 17:54:32
Intel在20號的清晨正式揭露了第12代處理器Alder Lake的技術細節,其中最大的改變就是製程從萬年14nm+++升級為Intel 7(原10nm+++),並且換上了大核心+小核心的全新架構設計,其中大核心Intel將其命名為「P-Core(效能核心)」、小核心則稱之為「E-Core(效率核心)」。
在設計上,利用更為精密的Intel 7製程,E-Core能夠容納更大的快取、更多的通道線路。首先在前端負責接收任務的指令快取(Instruction Cache)上,E-Core的容量擴增到了64KB,同時透過把目標快取分支的數量拉高到5,000條與縮短和指令快取的距離,讓指令的分析預測能有更高的效率和精準度,降低後期處理器做無用功的可能。
分析完指令後,接著就是將這些指令進行解碼,E-Core配置了2組3通道的Order Decode指令解碼區塊,能夠在單次週期處理6個指令。緊接著,在分派任務給處理單元的部分,Intel也把整個調配通道也加大,配置了5條分派通道(five-wide allocation)和8條引退通道(eight-wide retire)、256個條目亂序視窗(Entry Out Of Order Window)與8條執行埠(Execution Port)。
簡單來說,玩家可以想像一顆核心中有各式各樣的服務窗口,上述通道的功能則是各個窗口的指引和路線,而指令就要來辦理服務的民眾,透過增加更多的通道和指引就能讓指令可以更快更方便的找到對應的窗口,減少指令全部擠在單一通道,造成塞車、運算效率低落的問題。
最後指令來到了處理核心的部分,Intel為E-Core規劃了4組ALU、2個Load AGU、2個Stored AGU、2個Jump Port、2個Integer Store Data、2個FP/Vec Store Data 、2個FP/Vec stacks、3rd Vec ALU,總計17個執行埠(玩家可以想像成不同服務項目的櫃檯數量)。
比較特別的是,Inte配置了2組Load/Store AGU,還將L2快取容量加大為4MB,配合更深的緩衝、更先進的預先取用機制,以此來達到更好的處理效率,另外搭配Intel Resource Director技術,讓軟體可以直接管控這些核心的執行緒,達到公平分配工作量的效果,防止傳說中「一核有難,全核圍觀」的問題。
E-Core個別配置了2組Load AGU和Store AGU,搭配大容量的4MB L2快取,提供更好的處理效率,還可以利用Intel Resource Director技術讓軟體直接管理執行緒,達到更公平的資源分配。
而在安全防護性上,Intel為E-Core加入多種安全功能的支援,包含Intel Control-Flow Enforcement Technology 以及 Intel Virtualization Technology Redirection Protection、FMA、VNNI。
以效能來說,E-Core對比2015年的Skylake架構處理器在1C/1T的模式下,在同功耗下有著40%的效能提升,反之在相同效能的前提下則能省電40%。而在相同執行續數量的比較模式下,4C4T的E-Core則不論是效能還是省電上都比2C/4T的Skylake好上80%,也就是4顆E-Core加起來不僅比兩顆Skylake省電,效能還更強。
在內部設計上,負責接收指令的核心前端被大幅度加大、加深,以此來容納更多處理單位,像是4K指令緩衝區(4K iTLB)從128提升為256、目標快取的分支從5,000個暴增到12,000個,並透過更智慧的分支預測、降低L1快取延遲、L2 全快取寫入預測及頻寬最佳化等方式,創造更快更有效率的指令處理效率。
當然,尺寸加大的不只是前端的區塊,其他諸如負責指令解碼的Decode核心從4個增加到6個,負責任務分配的Out Of Order Engine也加寬到6組分派通道(six-wide allocation)、12組執行埠(Execution Port),同時更深的512-entry Reorder-Buffer緩衝換來更大的Scheduler調度緩衝空間,讓更多的指令可以處在rename / allocation階段。
指令分派的Out Of Order Engine加寬到6組分派通道、12組執行埠,容量更大的512-entry Reorder-Buffer和Scheduler調度緩衝空間能夠容許更多指令處在rename / allocation階段。
最後來到負責執行的處理單元,P-Core擁有5組ALU整數邏輯單元、Vector 運算則有了效率更快、延遲更低的FADD單元輔助,FMA指令集單元則是能夠支援FP16資料格式和Intel近來喜愛主打的AVX-512指令集,同時隨著處理單元的變多,L1和L2快取在尺寸和容量上也相應的增大。
除此之外,P-Core還加入全新的Advanced Matrix Extensions(AMX)技術,這是針對下一代深度學習所打造,就由內建AI加速器的形式,能夠大幅度的提升矩陣乘法運算速度。
P-Core在新製程、新架構的加持下,對比11代的Rocket Lake能夠有著19%的IPC指令週期的提升。若再加上針對Windows 11系統所特別設計的Intel Thread Director功能,讓每顆核心的資源可以隨心所欲的調動,由低延遲與彈性調動的方式,讓Alder Lake能夠徹底發揮大核+小核配置效能優勢。
★快來追蹤/加入我們!!!
FB玩家社團:PCDIY!玩家FB社團
Instagram頻道:pcdiytw
效率核心,E-Core
Alder Lake的E-Core使用了代號為「Gracemont」的架構,追求以最少的功耗達到更高的指令吞吐效率,全系列的Alder Lake處理器不論是桌機還是行動裝置都擁有相同的8核心E-Core配置,但由於此架構本身是為輕度工作需求,所以將不具備多執行緒(Thread)功能。在設計上,利用更為精密的Intel 7製程,E-Core能夠容納更大的快取、更多的通道線路。首先在前端負責接收任務的指令快取(Instruction Cache)上,E-Core的容量擴增到了64KB,同時透過把目標快取分支的數量拉高到5,000條與縮短和指令快取的距離,讓指令的分析預測能有更高的效率和精準度,降低後期處理器做無用功的可能。
分析完指令後,接著就是將這些指令進行解碼,E-Core配置了2組3通道的Order Decode指令解碼區塊,能夠在單次週期處理6個指令。緊接著,在分派任務給處理單元的部分,Intel也把整個調配通道也加大,配置了5條分派通道(five-wide allocation)和8條引退通道(eight-wide retire)、256個條目亂序視窗(Entry Out Of Order Window)與8條執行埠(Execution Port)。
簡單來說,玩家可以想像一顆核心中有各式各樣的服務窗口,上述通道的功能則是各個窗口的指引和路線,而指令就要來辦理服務的民眾,透過增加更多的通道和指引就能讓指令可以更快更方便的找到對應的窗口,減少指令全部擠在單一通道,造成塞車、運算效率低落的問題。
最後指令來到了處理核心的部分,Intel為E-Core規劃了4組ALU、2個Load AGU、2個Stored AGU、2個Jump Port、2個Integer Store Data、2個FP/Vec Store Data 、2個FP/Vec stacks、3rd Vec ALU,總計17個執行埠(玩家可以想像成不同服務項目的櫃檯數量)。
比較特別的是,Inte配置了2組Load/Store AGU,還將L2快取容量加大為4MB,配合更深的緩衝、更先進的預先取用機制,以此來達到更好的處理效率,另外搭配Intel Resource Director技術,讓軟體可以直接管控這些核心的執行緒,達到公平分配工作量的效果,防止傳說中「一核有難,全核圍觀」的問題。

而在安全防護性上,Intel為E-Core加入多種安全功能的支援,包含Intel Control-Flow Enforcement Technology 以及 Intel Virtualization Technology Redirection Protection、FMA、VNNI。
以效能來說,E-Core對比2015年的Skylake架構處理器在1C/1T的模式下,在同功耗下有著40%的效能提升,反之在相同效能的前提下則能省電40%。而在相同執行續數量的比較模式下,4C4T的E-Core則不論是效能還是省電上都比2C/4T的Skylake好上80%,也就是4顆E-Core加起來不僅比兩顆Skylake省電,效能還更強。
效能核心,P-Core
看完了E-Core小核心,來看看代號為「Golden Cove」的P-Core大核心這邊,其目的專注於更低的延遲、更高的時脈,為極限的效能而生,也因此P-Core的面積要比E-Core大上不少,並支援多執行緒功能,但相對的所需功耗和帶來的發熱也就跟著大幅提高,這也是為何不同等級的處理器產品所配置的P-Core數量會有所不同,其中主機平台的P-Core數量達到8C/16T、筆電為6C/12T、行動裝置則只剩下2C/4T。在內部設計上,負責接收指令的核心前端被大幅度加大、加深,以此來容納更多處理單位,像是4K指令緩衝區(4K iTLB)從128提升為256、目標快取的分支從5,000個暴增到12,000個,並透過更智慧的分支預測、降低L1快取延遲、L2 全快取寫入預測及頻寬最佳化等方式,創造更快更有效率的指令處理效率。
當然,尺寸加大的不只是前端的區塊,其他諸如負責指令解碼的Decode核心從4個增加到6個,負責任務分配的Out Of Order Engine也加寬到6組分派通道(six-wide allocation)、12組執行埠(Execution Port),同時更深的512-entry Reorder-Buffer緩衝換來更大的Scheduler調度緩衝空間,讓更多的指令可以處在rename / allocation階段。

最後來到負責執行的處理單元,P-Core擁有5組ALU整數邏輯單元、Vector 運算則有了效率更快、延遲更低的FADD單元輔助,FMA指令集單元則是能夠支援FP16資料格式和Intel近來喜愛主打的AVX-512指令集,同時隨著處理單元的變多,L1和L2快取在尺寸和容量上也相應的增大。
除此之外,P-Core還加入全新的Advanced Matrix Extensions(AMX)技術,這是針對下一代深度學習所打造,就由內建AI加速器的形式,能夠大幅度的提升矩陣乘法運算速度。
P-Core在新製程、新架構的加持下,對比11代的Rocket Lake能夠有著19%的IPC指令週期的提升。若再加上針對Windows 11系統所特別設計的Intel Thread Director功能,讓每顆核心的資源可以隨心所欲的調動,由低延遲與彈性調動的方式,讓Alder Lake能夠徹底發揮大核+小核配置效能優勢。
★快來追蹤/加入我們!!!
FB玩家社團:PCDIY!玩家FB社團
Instagram頻道:pcdiytw
- 發表您的看法
請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。
請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。
請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。
請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。
請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。
您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。
最近新增
- 摺 才叫帥!Motorola razr 60系列攜Pantone 潮色登場 時尚摺疊OG始祖Motorola x 嘻哈OG男神 瘦子 E.SO 科技與經典時尚盡在motorola razr 60|60 ULTRA
- 專家全方位剖析 AI 2.0 產業生態系與企業AI中心佈建關鍵 AI NEXT FORUM將於5月6日登場 多家科技大廠現場展示企業AI創新解方
- 群暉正式推出2025年式2.5GbE NAS!「Synology DiskStation新一代DS225+、DS425+、DS625slim、DS725+、DS925+、DS1525+、DS1825+、DS1825xs+與RackStation RS2825RP+」強勢來襲,全面啟動「Synology 儲存系統硬碟相容性政策」,並邀請硬碟業者參與「AVL相容性清單硬碟認證計畫」
- 曜越推出ATX 3.1金牌認證電源 鋼影TOUGHPOWER GT 1000W/1200W
- InnoVEX 450家新創齊聚 引領全球創新浪潮
- Sony 發表 E 接環 FE50-150mm F2 GM 鏡頭 全球首款達150mm F2
- 工控資安再升級!華碩智慧物聯網榮獲IEC 62443-4-1認證
- 再造進化!華碩、ROG創新出擊COMPUTEX 2025
- 網石歡慶《我獨自升級: ARISE》上市1周年 大規模更新與活動即將登場
- 微軟發佈《2025 工作趨勢指數》報告 揭示「AI 前瞻企業」興起 超過 8 成台灣企業預計於未來 18 個月內導入 Agents Microsoft 365 Copilot 強勢更新 強化下一代 AI 人機協作體驗
- 強力貫穿、寂靜高效,NZXT 全新世代 靜音扇/靜壓扇,水冷/塔散/機殼完全適配,滿足穿透與寧靜的風流渴望!
- Acer Nitro VG240Y P6 電競螢幕 144Hz高刷新升級上市
最多人點閱
- GIGABYTE GeForce GTX 1070 Xtreme Gaming實測開箱,電競級顯示卡中的頂尖之作!
- Seagate IRONWOLF 10TB機械硬碟實測開箱,氦氣填充那嘶狼守護者NAS HDD
- AMD Radeon RX 480實測開箱,玩家級顯示卡重返榮耀!
- PLEXTOR S2C 512GB實測開箱,超值型固態硬碟中的優質好貨!
- 洋垃圾神器,Xeon E5-2670實測開箱大作戰!
- MSI CORE FROZR L CPU散熱器實測開箱,微星電競產品再添新兵
- MSI GeForce GTX 1060 GAMING X 6G實測開箱,玩家級電競顯示卡中的神兵利器!
- ASUS ROG STRIX-GTX1080-O8G-GAMING開箱實測,旗艦三風扇電競顯示卡中的頂尖之作!
- MSI GeForce GTX 1080 GAMING X 8G實測開箱,史上最強大Pascal自製顯示卡全面來襲!
- 淘寶網洋垃圾再顯神威,1999元買到8核心16執行緒Xeon E5-2670神器級處理器!
- MSI GeForce GTX 1050 Ti GAMING X 4G實測開箱,中階電競顯示卡中的玩家精品!
- 微星MSI Aegis X-026TW快打旋風V同梱版實測開箱,VR電競桌機的頂尖之作!
