焦點

「真正」的改朝換代近在眼前,Intel第12代處理器Alder Lake正式登場與開賣前總複習

文.圖/Lucky 2021-10-28 00:00:01
千呼萬喚,等到花兒都快謝了的Intel第12代處理器終於迎來了第一波解禁啦!不得不說,這一代處理器就許多方面都相當具有歷史意義,畢竟這可是Intel睽違7年後的再一次製程升級,從一用再用的14nm+++…換成了Intel 7(原本的10nm)製程,同時還在處理器中導入了大核心+小核心的雙重架構設計,更是首個支援DDR5、PCIe 5.0通道等新世代通道功能的處理器系列,真的是把自家的各種壓箱寶通通端了出來。


然而因為第一波解禁只能夠談論外觀,實際效能解禁要到11/4的關係,所以小編在這邊除了讓大家簡單「欣賞」第12代處理器的樣貌外,也順便替重新整理一下處理器的相關規格,算是當作正式開賣前的總複習吧!

全新的大核心+小核設計
本次12代處理器與過往最大的不同莫過於內在使用了大核+小核的雙核心架構設計,兩種核心均採用Intel 7製程,其中大核心主要負責繁重的運算工作,官方將其命名為效能核心,簡稱「P-Core」;小核心以負責較輕度的運算內容,主打更高的指令吞吐效率,故稱它為效率核心「E-Core」。

Alder Lake處理器將使用Intel 7製成,核心改採大核心+小核心的設計。


需要注意的是,這一次Alder Lake不光會推出桌機版本,未來筆電、低功耗行動裝置也都將採用Alder Lake處理器,不再像過去一樣使用不同架構的產品,只是因應不同等級定位的產品,大、小核心的配置上會略有不同,例如桌機平台的P-Core最大數量可以來到8顆,而筆電平台的最高就只剩下6顆。

Alder Lake將涵蓋主機、筆電、行動裝置,並因應不同平台使用不同數量的核心配置,其中主機擁有最多核心數量。


掌管繁雜運算的大核心,P-Core
Alder Lake處理器的P-Core,採用代號為Golden Cove的核心設計架構,其目的在創造運算上更低的延遲、更高的時脈,為極限的效能而生,是高效能運算的主力擔當,也因此P-Core整體的晶片面積會比E-Core大上不少,並能夠支援多執行緒、AVX512指令集等功能。

P-Core各區的功能一覽。


只是高效能的代價就是所需功耗和帶來的發熱也就跟著大幅提高,這也是為何不同等級的處理器產品所配置的P-Core數量會有所不同,其中主機平台的P-Core數量達到8C/16T、筆電為6C/12T、行動裝置則只剩下2C/4T。

在細部設計上,P-Core因為有著更大的晶片面積,配上精度更高Intel 7製程,讓核心內各項的處理單位數量都被加大、加深,像是4K指令緩衝區(4K iTLB)從128提升為256、目標快取的分支從5,000個暴增到12,000個,其他諸如負責指令解碼的Decode核心從4個增加到6個、L2快取緩衝提升到2MB等,簡單來說,就好比一個公司部門有更多的人力和可以協助工作。

指令分派的Out Of Order Engine加寬到6組分派通道、12組執行埠,容量更大的512-entry Reorder-Buffer和Scheduler調度緩衝空間能夠容許更多指令處在rename / allocation階段。

P-Core擁有5組ALU整數邏輯單元。

核心加入了FADD單元提供有效率、延遲更低的運算;FMA單元能夠支援FP16資料格式和AVX-512指令集。

L1快取通道從2組變為3組,容量也有所增加。

L2快去的尺寸大幅加大,容量也來到2MB。


除此之外,考慮到機器學習、深度運算等功能已經從研究開發逐漸進入日常生活應用,向是Adobe Photoshop便導入智慧運算功能進行物體選取、去背,甚至是解析度提升等,為此P-Core還加入全新的Advanced Matrix Extensions(AMX)技術,其功能主要用以應付電腦的深度學習功能所打造,藉由內建AI加速器的形式,提升矩陣乘法運算速度,理論上能夠讓我們在使用到有牽涉到深度學習運算的應用時,能夠更快的完成運算,減少我們在螢幕前枯等的時間。

AMX技術能夠加速深度運算學習,強法矩陣乘法運算速度。

P-Core的整體IPC效能將比上一代Rocket Lake高出19%。


省電也要兼具效能的小核心,E-Core
E-Core採用代號為Grace mount,本身主要負責輕度運算,讓主機能夠用更少的功耗去負責一些日常向是待機、逛網頁等瑣碎的輕度工作,因此核心本身不具備多執行續功能,也無法支援高難度的AVX-512指令集,同時不論是主機還是低功耗裝置版的處理器,E-Core的核心數量都8C/8T。

E-Core核心的分區規劃。


E-Core在設計的首要目標是盡可能接收和消化更多的操作指令,好讓P-Core能夠專注於完成難度較高的內容,因此E-Core雖然核心面積較小,快取的容量卻很大,例如單顆核心的L2快取的容量就達到了4 MB,比P-Core大核心高出一倍!

Intel把E-Core前端區域的指令快取加大到64KB,並讓目標快取的分支數量來到5,000個,配合指令預測功能,提高指令的準確度。

Core-E擁有2組3通道指令解碼區塊,讓核心可以一次處理6道指令。

E-Core有5條分派通道、8條引退通道、256個條目亂序視窗、8條執行埠。

E-Core各項處理單元的配置。


此外為了防止軟體分配錯誤的工作比重,造成小核出事、大核圍觀的局面,小核心導入Intel Resource Director技術,能夠讓不同程式去直接管理核心的調用,達到公平分配工作量的效果。

E-Core個別配置了2組Load AGU和Store AGU,搭配大容量的4MB L2快取,提供更好的處理效率,還可以利用Intel Resource Director技術讓軟體直接管理執行緒,達到更公平的資源分配。


以效能來說,E-Core對比2015年的Skylake架構處理器在1C/1T的模式下,在同功耗下有著40%的效能提升,反之在相同效能的前提下則能省電40%。而在相同執行續數量的比較模式下,4C4T的E-Core則不論是效能還是省電上都比2C/4T的Skylake好上80%,也就是4顆E-Core加起來不僅比兩顆Skylake省電,效能還更強。

在都是1C/1T的情況下,E-Core比Skylake要有40%的效能/省電的效率。

若是將標準改為都是4執行緒的情況下,E-Core即使是4C/4T,在省電和效能更是大勝2C/4T的Skylake處理器80%之多。


Alder Lake大核+小核齊作工
看完了大核心P-Core和小核心E-Core後,接著就要讓這兩種核心組裝在一起,才變成一整顆的Alder Lake處理器了。這一次Intel整顆處理器導入過去自己瞧不起的「Fabric」線路橋接技術(俗稱膠水拼接),利用各種內部線路來連接處理起的不同核心其區塊,例如串聯P-Core和E-Core的就是有著1,000 GB/s頻寬的「Compute Fabric」,還有像是204 GB/s頻寬的Memory Fabric來連接記憶體控制區塊、64 GB/s的I/O Fabric則負責各項擴充設備的資料傳輸等。

處理器的內部使用有著1,000 GB/s頻寬的「Compute Fabric」來連接P-Core和E-Core。


透過這樣的設計,除了能夠在保證區塊間的資料傳輸效率外,也因為每個區塊可以分開生產後再進行合併,實現了模組化的功能,整體生產難度可以降低,也能夠輕鬆地修改不同等級之間的處理器規格配置,缺點就是這些線路會占用更多的處理器空間,使處理器的尺寸加大,這也就是為什麼Alder Lake處理器從過往的正方形變成了長方形,也使得這一代處理器不光換腳位,還要連同散熱器的固定工具都連帶更換。

如果不使用相符的安裝工具,散熱器的貼合就會像圖中右邊的兩組範例一樣,出現不均勻的情況。


然而搞定大核+小核心的連接只是第一步,精準的控制每顆核心之間的資源調度才是讓處理器發揮完整的關鍵,於是Intel與微軟合作(反正和Apple之間已經…),在Windows 11平台導入了名為「Thread Director Technology」的核心調度功能。

Intel為Alder Lake處理器的核心資源調度導入了「Thread Director Technology」功能。


這項技術除了能夠判斷程式的負載需求來決定工作應該由P-Core還是E-Core來執行外,還能動態調整每個任務所使用的核心種類,Alder Lake會自動偵測任務的複雜程度,當有更耗資源的程式進駐時,就會即刻重新評估各個程式在每個指令步驟下所需的效能,將不需高效能的命令從P-Core轉移到E-Core中的,以此來盡可能的讓P-Core去負責絕大多數的高強度運算,發揮大+小核的完整執行效率。

高負載的程式會被派駐到高效能的P-Core中。

一般待機、基礎低負載的任務則是來到省電的E-Core中。

如果在P-Core核心滿載的狀態下,又有更複雜的命令來到時,Alder Lake會通知系統準備進行資源調配。

處理器開始分析,將不需要P-Core高性能核心責的任務轉移到E-Core中,讓P-Core的資源能夠騰出給更複雜的任務。

每個核心的資源分配都能不斷的互相調度,達到更具效率的運算處理。


最後在新增的功能方面,Alder Lake將重點放在上一代被詬病的孱弱連接能力上,能夠原生支援DDR5-4800和LPDDR5-5200,成為首個能夠支援DDR5記憶體的處理器系列。

Intel正式確認處理器將能原生支援DDR5記憶體。


與此同時,CPU本身更能夠支援頻寬比PCIe 4.0高出一倍的PCIe 5.0通道,而且一口氣就能支援16條,換算下來的頻寬約是64 GB/s!然而畢竟目前幾乎沒有任何PCIe 5.0的裝置可以使用,所以PCIe 5.0本身能夠向下相容歷代的PCIe版本通道,且CPU本身也還是備有4條PCIe 4.0通道用來安裝M.2 SSD。

先不要急著吐槽4條PCIe 4.0通道的實用性未免也太低,別忘了處理器還會在搭配一顆南橋晶片組,與之對應的Z690晶片組在連接能力同樣有獲得大幅度提升,可以支援最高16組的PCIe 3.0通道和12組的PCIe 4.0通道,考量到CPU的PCIe 5.0通道在主機板上可能都優先提供給了顯示卡等大型裝置,所以Z690晶片組的12條PCIe 4.0通道將有很大的機率將會通通提供給M.2插槽,加上CPU的4組,整個主機板最高將可以安裝高達4顆的PCIe 4.0 M.2 SSD!這下Intel玩家終於不必再抱怨M.2插槽的通道速度不夠了!

Alder Lake能夠支援PCIe 5.0x16,64GB/s的通道頻寬是PCIe 4.0的兩倍,另外PCIe 3.0和多數的PCIe 4.0通道則是移到的南僑晶片上。


第12代處理器Alder Lake快速動眼看
本篇的最後,讓我們來看看這顆等待已久的Intel第12代Alder Lake處理器吧!整體來說,新的處理器對比上一代處理器,長度變得更長,厚度也增加了一點點,此外也可以發現處理器也依然保有防呆凹槽的設計,只是位置從原本位在處理器左右兩側的防呆凹槽移到上下兩邊。

小編這次拿到的是12代處理器中最高階的Core i9-12900K。

因應處理器製程、外型全都換新,處理器的腳位改為LGA 1700。

讓12代處理器與上一代產品比較,外型之間的差異變得更為明顯了。

厚度上12代處理器也稍微增加了一些。

兩代處理器的背面,可以看到12代處理器的防呆凹槽數量從2個變為4個,位置也從左右兩邊變成上下兩邊。



11月4日見證新世代效能威力
第12代Alder Lake處理器對於Intel而言可以說是一款意義重大的產品,不光是因為他是第一款用上Intel 7製程的桌上型處理器,同時也兼具與AMD和Apple相對抗的重任,能否挽回這段日子流失的市佔從谷底翻身,可就全部得看處理器在效能方面的表現了。只是很可惜,因為官方的要求,本次只能向大家介紹第12代處理器的基本規格以及外型,真正的效能實測解禁需要等到11月4號才能夠向大家分享,所以只好請各位再忍耐一下,並千萬記得持續鎖定PCDIY!,才能在第一時間見到12代處理器的相關產品與實測報導喔!

12代即將開賣的首發6款新版本相關資訊



★快來追蹤/加入我們!!!
FB玩家社團:PCDIY!玩家FB社團
Instagram頻道:pcdiytw

發表您的看法

請勿張貼任何涉及冒名、人身攻擊、情緒謾罵、或內容涉及非法的言論。

請勿張貼任何帶有商業或宣傳、廣告用途的垃圾內容及連結。

請勿侵犯個人隱私權,將他人資料公開張貼在留言版內。

請勿重複留言(包括跨版重複留言)或發表與各文章主題無關的文章。

請勿張貼涉及未經證實或明顯傷害個人名譽或企業形象聲譽的文章。

您在留言版發表的內容需自負言論之法律責任,所有言論不代表PCDIY!雜誌立場,違反上述規定之留言,PCDIY!雜誌有權逕行刪除您的留言。