藍色巨人歸來

2021-11-11 19:45:06

新潮電子 2021年10期

Alder Lake將采用性能核+能效核的混合構(gòu)架

其實2020年的構(gòu)架日，英特爾便提及了AlderLake將采用混合構(gòu)架的信息，不過當時并沒有展開具體內(nèi)容。時隔一年，英特爾將Alder Lake除了需要在10月發(fā)布會上公布的具體參數(shù)外的所有構(gòu)架信息公之于眾。

按此前公布的產(chǎn)品路線圖，Alder Lake采用了Intel 7的優(yōu)化設(shè)計，按英特爾自己的說法，這是至Skylake以來，英特爾十多年來為x86架構(gòu)帶來的最大進展之一。其中最核心的技術(shù)便是“性能混合架構(gòu)”，將處理器核心分為性能核（P-Core）和能效核（E-Core），分別為8核16線程和8核8線程構(gòu)架。

比起以往英特爾采用過的Atom Mont核，新的能效核微架構(gòu)能夠在低電壓下運行，以降低功耗，同時為在更高頻率下工作創(chuàng)造內(nèi)部功率空間。如果與Skylake相比，單個能效核比單個個Skylake內(nèi)核性能提升40%，功耗反而降低40%。Skylake 內(nèi)核要達到同樣的性能，功耗會增加 2.5 倍。

Alder Lake的性能核同樣被稱為“迄今為止性能最高的CPU內(nèi)核”，比起11代酷睿的CypressCove，在通用性能的ISO頻率下，針對大范圍的工作負載實現(xiàn)了平均約19%的改進。在我看來，這樣的表述主要還是為了表明在單線程情況下處理器的最大負荷能力，當然具體的數(shù)值需要留待10月發(fā)布會時才會獲知。

英特爾進一步表明，混合架構(gòu)與ARM的大小核的設(shè)計不同，比如性能核和能效核與傳統(tǒng)意義上的Cove和Mont并不相同，兩者間是基于構(gòu)架的結(jié)合，也就是性能混合的組合，由此可以組成一個更寬、更深、更智能的架構(gòu)，它的執(zhí)行并性行，時延和通用性能等參數(shù)上都超越以往的處理器平臺，更適于大數(shù)據(jù)集和大型代碼體積的應(yīng)用程序。另外，性能核和能效核之間可以分別采用更大跨度的產(chǎn)品，理論上可以將高性能的臺式機處理器和定位超輕薄的處理器以混合架構(gòu)的形式進行組合。

當然，有人會說，采用混合構(gòu)架提升CPU平臺的功耗控制，對于臺式機平臺有什么作用呢？其實新構(gòu)架能夠帶給CPU更合理的內(nèi)部結(jié)構(gòu)，要知道一個能效核在DIE上僅占性能核的1/4，卻能有效增加多線程的執(zhí)行能力;而性能核則為追求更高的單線程高性能、低時延，并提供AI加速能力，這樣的構(gòu)架比以往更加合理。

此次英特爾并未公布性能核和能效核是否在同一電壓和頻率之下，不過按現(xiàn)有的資料來看，AlderLake很有可能采用同步多核的技術(shù)。目前ARM構(gòu)架的大小核很多都采用了異步多核架構(gòu)，雖然異步多核能夠?qū)崿F(xiàn)小核心更極端的低頻率、低功耗的運行，但異步頻率架構(gòu)會產(chǎn)生性能損失，核間通信延遲高。

更為高效的線程級資源調(diào)用—Intel Thread Director

英特爾混合構(gòu)架與其他大小核構(gòu)架的區(qū)別，我認為最重要的還包含這個英特爾硬件線程調(diào)度器（Intel ThreadDirector），它集成在CPU的硬件控制器（微控制器）內(nèi)，主要能夠讓能效核和性能核實現(xiàn)智能協(xié)同運行。

與A RM構(gòu)架大小核的資源調(diào)用不同，它首先是提供線程級的調(diào)用—“Thread Director”，并不參與到，具體任務(wù)的調(diào)用過程，而是將其與Windows 11的任務(wù)調(diào)度器對接，不需要軟件開發(fā)人員改寫需求。而ARM構(gòu)架大小核是按任務(wù)來調(diào)用核心資源，比如會將短信、時鐘、計算器等計算壓力不大的任務(wù)分配給省電的小核;而將游戲、視頻等任務(wù)分配給大核，雖然很多AMR構(gòu)架會開放API供各個OEM廠商改寫資源調(diào)用規(guī)則，但無論如何，軟件工程師都不可能完全預(yù)估用戶所有的應(yīng)用場景，所以有可能出現(xiàn)“一核累死、多核圍觀”的情況。

其次，英特爾硬件線程調(diào)度器的智能協(xié)同運行按官方的原話是這樣描述的：“更精細地監(jiān)控指令組合、每內(nèi)核當前狀態(tài)以及相關(guān)的微架構(gòu)遙測，從而更智能地協(xié)助操作系統(tǒng)對任務(wù)進行調(diào)度優(yōu)化。它使用真實世界的硬件遙測來引導(dǎo)操作系統(tǒng)到正確的工作負載，這可以在正確的時間被引導(dǎo)到正確的核心。線程控制器是完全動態(tài)的、自適應(yīng)的、自主的，而不是靜態(tài)的、確定性的、軟件的方法?！?/p>

我的理解是它采用了一個相對合理、動態(tài)的調(diào)用機制的。比如在性能核占滿的情況下，有新的高性能需求的線程進入，調(diào)度器會協(xié)調(diào)一個性能核線程到能效核當中，保證高性能需求線程的及時響應(yīng)。我們

不妨來看看線程的實際調(diào)用情況：一般而言，需要更高性能和更低時延的矢量任務(wù)（深藍色）優(yōu)先使用性能核，標量指令（綠色）和后臺任務(wù)（淺藍色）主要分配給能效核。上圖的影視內(nèi)容創(chuàng)造中便使用了這樣的規(guī)則。

Office場景下，AI線程（橙色）主要在性能核下執(zhí)行，而后臺程序（淺藍色）則進入能效核。我們可以看到，幾乎所有的應(yīng)用場景下，英特爾的這套混合構(gòu)架非常注重性能的均衡，沒有出現(xiàn)1核跑滿，7核圍觀的情況出現(xiàn)。

另外，在我理解，英特爾硬件線程調(diào)度器只規(guī)定線程級的大規(guī)則，具體資源調(diào)的指令用交給Windows 11操作系統(tǒng)，這樣的好處在于僅通過Windows升級便能優(yōu)化資源調(diào)用效率，而且線程調(diào)用效率更高—約微秒的時間里確定一個線程的性質(zhì)、歸屬，而傳統(tǒng)的系統(tǒng)調(diào)度器需要上百甚至幾百微秒，還可能分配錯誤。

不好的消息是，Windows 10系統(tǒng)的用戶極可能享受不到這一功能，因為它僅有一個基礎(chǔ)版的Intel HGS（硬件指引調(diào)度），針對Intel Thread Director進行優(yōu)化前安裝Alder Lake很可能僅是安裝了一個主核性能升級的Rocket Lake，所以能升級的用戶盡量升級?。。?！另外，據(jù)稱英特爾也會針對Linux內(nèi)核進行優(yōu)化，目前暫未公布上市時間。

從產(chǎn)品形態(tài)來看，Alder Lake依舊包含了三類產(chǎn)品，10月發(fā)布會會具體公布產(chǎn)品型號：

1. 高性能、雙芯片、插座式的臺式機設(shè)計，具有領(lǐng)先性能、能效、內(nèi)存和I/O。

2. 高性能筆記本處理器，采用BGA封裝，配置圖像單元，更大的 Xe 顯卡和Thunderbolt 4 連接。

3. 輕薄低功耗筆記本處理器，采用高密度封裝和配置優(yōu)化的I/O和電能輸出獨立顯卡終現(xiàn)，Xe HPG帶來完全不同的顯示微構(gòu)架構(gòu)架日前兩天，英特爾公布了高性能顯卡品牌“Intel Arc”，顯然是比銳炬更高端的產(chǎn)品線。英特爾已經(jīng)明確表示它將采用獨立顯卡構(gòu)架，并支持基于硬件的光線追蹤、AI驅(qū)動的超級采樣，并完整支持DX12 Ultimate，這一點還是相當令人激動的。令我沒想到的是，蘋果M1顯示芯片的光追功能，居然也是采用的英特爾光線追蹤數(shù)據(jù)庫，不得不說英特爾“軟件優(yōu)先”的強大實力依舊是行業(yè)領(lǐng)先的。

構(gòu)架日上，英特爾主要談及Xe顯卡的微架構(gòu)的設(shè)計方向，主要是關(guān)于高性能顯卡Xe HPG部分的內(nèi)容：此次，英特爾通過在一個統(tǒng)一的代碼庫中涵蓋集成和獨立顯卡產(chǎn)品的驅(qū)動設(shè)計，第一款高性能游戲顯卡將性能和質(zhì)量放在首位;英特爾已完成了內(nèi)核顯卡驅(qū)動程序組件的重新架構(gòu)，特別是內(nèi)存管理器和編譯器，從而使計算密集型游戲的吞吐量提高了15% （至多80%），游戲加載時間縮短了25%。

Xe HPG是一款全新的獨立顯卡微架構(gòu)，Xe內(nèi)核包含了16個矢量引擎、16個矩陣引擎，為Alchemist系列SoC提供動力，首批產(chǎn)品預(yù)計于2022年第一季度上市。值得注意的是，從這一代開始，英特爾不再使用EU的概念，不再以此為衡量顯卡性能的單向標準。原因很簡單，矢量引擎主要做畫面處理運算，而全新的矩陣引擎（Xe Matrix eXtensions，XMX）則為了加速AI工作負載，提升游戲體驗的指標將更為豐富。另外，新顯卡還引入了一個全新升頻技術(shù)（upscaling technology）—XeSS，這是為了進一步提高性能和游戲體驗的新技術(shù)，英特爾會向包括競爭對手在內(nèi)的產(chǎn)品上廣泛開放這一技術(shù)，以提升這項技術(shù)的普及速度。

AI加速上，新的Xe顯卡內(nèi)置了XMX AI加速，它通過深度學習，可以合成接近原生高分辨率渲染質(zhì)量的圖像;另外還可實現(xiàn)對前一幀進行運動補償，這其實也是通過相鄰像素，重建子補償幀的像素細節(jié)。另外，憑借DP4a指令，XeSS可以在包括集成顯卡在內(nèi)的各種硬件上提供基于AI的超級采樣，這為AI功能建立起一個良好的采樣基礎(chǔ)。

與此前Xe HP、Xe LP相比，Xe HPG也進一步增強了功率釋放。的確，如今市面上的獨臺顯卡功率高至200W以上，針對移動平臺設(shè)計的Xe LP明顯便不滿足競爭要求，所以Xe HPG需要在功耗上“更有彈性”，而且采用了更高密度的TSMC N6制程，放入更多的處理單元，進一步提升性能表現(xiàn)。

還需要談到的是，Xe HPG的產(chǎn)品將在英特爾的產(chǎn)品體系中延續(xù)多代，不僅包括首代基于Xe HPG微架構(gòu)的Alchemist SoC（DG2），還將包括代號分別為Battlemage、Celestial和Druid的后續(xù)幾代產(chǎn)品。

下一代數(shù)據(jù)中心處理器平臺SapphireRapids事實上，英特爾數(shù)據(jù)中心處理器平臺Ice Lake才在4月份發(fā)布，僅4個月之后，英特爾便在構(gòu)架日公布了基于Intel 7制程工藝技術(shù)制造的新一代數(shù)據(jù)中心處理器平臺Sapphire Rapids。比起上一代，它進一步提升了速度、低時延和單線程應(yīng)用性能的極限，并對工作負載進行優(yōu)化，以在云、微服務(wù)和AI等彈性計算模型上提供高性能。

Sapphire Rapids的另一核心優(yōu)勢在于采用了分區(qū)塊、模塊化的SoC架構(gòu)。它采用了英特爾的嵌入式多芯片互連橋接（EMIB）封裝技術(shù)，在保持單晶片CPU接口優(yōu)勢的同時，具有顯著的可擴展性。

Sapphire Rapids上集成了英特爾加速器接口架構(gòu)指令集（AI A）、英特爾高級矩陣擴展（AMX）、英特爾數(shù)據(jù)流加速器（DSA）在內(nèi)的內(nèi)置加速器引擎，以在各種客戶工作負載和使用中提升性能。

更為清晰地了解 IPU

在6月份發(fā)布這種可編程的網(wǎng)絡(luò)設(shè)備平臺IPU之后，英特爾在架構(gòu)日進一步宣稱了這一設(shè)計的優(yōu)勢。我們在此前針對IPU進行過2～3次專項報道，同時也對ACIS和FPGA兩大技術(shù)流融合的趨勢進行了具體表述。具體就英特爾的IPU而言，它比CPU在性

能利用率上有更大的優(yōu)勢：

優(yōu)勢一：能清晰地隔離基礎(chǔ)設(shè)施功能和租戶的工作負載，從而使租戶可以全面掌控CPU

優(yōu)勢二：為基礎(chǔ)設(shè)施功能減負

優(yōu)勢三：它支持遷移到全面的無磁盤服務(wù)器架構(gòu)

另外，英特爾還談及了Mount Evans和OakSprings Canyon兩個IPU的基本應(yīng)用平臺：MountEvans是與一家一流的云服務(wù)提供商共同設(shè)計和開發(fā)的，它融合了多代FPGA SmartNIC的經(jīng)驗;OakSprings Canyon是一個IPU參考平臺，基于英特爾至強 D 處理器（Intel Xeon-D）和擁有業(yè)界領(lǐng)先的功率、效率、性能的英特爾 Agilex FPGA構(gòu)建。

英特爾還針對搭載至強服務(wù)器設(shè)計的SmartNIC開放了代號為“Arrow Creek”的N6000加速開發(fā)平臺。它內(nèi)置英特爾Agilex FPGA和用于高性能100GB網(wǎng)絡(luò)加速的英特爾以太網(wǎng)800系列控制器，支持多種基礎(chǔ)設(shè)施工作負載，使通信服務(wù)提供商（CoSP）能夠提供靈活的加速工作負載，如JuniperContrai、l OVS和SRv6。

英特爾迄今為止最復(fù)雜的SoC

Ponte Vecchio是能充分顯示英特爾在生產(chǎn)端（IDM 2.0戰(zhàn)略）最強技術(shù)的產(chǎn)品之一。它擁有百億億次級運算的能力以及英特爾目前最高水平的計算密度和帶寬。Ponte Vecchio基于XeHPC微架構(gòu)，采用多種先進的半導(dǎo)體制程工藝、英特爾變革性的EMIB技術(shù)以及Foveros 3D封裝技術(shù)，提供業(yè)界領(lǐng)先的每秒浮點運算次數(shù)（FLOPs）和計算密度，以加速AI、HPC和高級分析工作負載。

Ponte Vecchio的核心，基于臺積電先進的N5制程工藝技術(shù)，是一個密集的多個Xe內(nèi)核。它同樣基于Intel 7制程工藝，針對Foveros技術(shù)進行了優(yōu)化。

它是一個集成化技術(shù)相當高的多個GPU集合，它的一個基礎(chǔ)單元便相當于一個GPU。

GPU間通過Xe 鏈路單元連接，支持每單元8個鏈路，也就是說每個單元均能夠使用獨立鏈路與其他單元相連，核間通信效率相當高。

進展迅速的oneAPI

此外，英特爾還公布了oneAPI的最新進展。自從2020年12月發(fā)布第一個版本以來，超過20萬名開發(fā)者在獲得Xe HPC之前就已經(jīng)安裝了英特爾的oneAPI產(chǎn)品。多個領(lǐng)域的獨立軟件開發(fā)商已經(jīng)推出了超過300個采用oneAPI統(tǒng)一編程模型的應(yīng)用軟件。而且，英特爾有80多個支持Xe HPC的關(guān)鍵HPC應(yīng)用軟件、AI框架和中間件，它們利用oneAPI快速移植當前基于CPU或CUDA的GPU實施。

寫在最后：

構(gòu)架日最后，帕特·基辛格（P a tGelsinger）的一句”Intel is back”讓我們看到，曾經(jīng)那個惟技術(shù)第一的藍色巨人回來了。作為英特爾公司第一任CTO，作為主導(dǎo)過80486等在英特爾發(fā)展史上有標志意義的產(chǎn)品開發(fā)的技術(shù)人員，基辛格比以往任務(wù)一屆CEO都更希望英特爾能夠?qū)Ｗ⒂诩夹g(shù)路線的發(fā)展，所以英特爾最近半年才會以如此高的頻度向媒體一再講述英特爾在生產(chǎn)、技術(shù)和產(chǎn)品上的進展。今天的構(gòu)架日公布如此多的信息，特別是像PonteVecchio這樣秀肌肉的產(chǎn)品，正是英特爾用產(chǎn)品宣告重回技術(shù)之巔的決心。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

藍色巨人歸來