国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

10年代的最終樂章 即將來臨的平臺大升級

2019-10-30 03:36
電腦愛好者 2019年14期
關鍵詞:制程英特爾內存

AMD第三代銳龍 性能為王

在整個市場即將迎來的巨大變化中,如果說產品、市場是廠商“玩家”們手里的一副牌(圖1),那么牌面應該就是產品的能力、價格等因素,而在牌面之下,真正決定了牌面大小的,卻是一些核心技術,其中最突出的就是制程和架構。

2019年下半年,“制程”將是新產品們特別吸引眼球的特性。AMD的CPU與GPU全面進入7nm時代,而英特爾的10nm制程也終于成熟,相關產品都會在下半年逐步進入市場。在同樣的架構下,更精細的制程工藝可以讓晶體管更小巧,芯片面積、成本、功耗等都會隨之降低。

當然,要想獲得更好的表現(xiàn),還需要用更適合制程進步的架構設計。例如AMD的7nm CPU和GPU就分別采用了新的Zen 2和RDNA架構,Intel也在首批10nm工藝CPU中使用新的Sunny Cove微內核架構,不過它在很長時間內將是移動平臺的獨享。

借助新制程與新架構,PC中最重要的兩個核心芯片——CPU和GPU都將在2019年下半年實現(xiàn)一次跨代。與之前的產品相比,這些引領我們進入20年代的新產品,究竟有著怎樣的實力呢?

在進入Zen架構時代后,AMD CPU又一次有了與英特爾爭奪性能皇冠的實力,近幾年也屢次奪得了最強消費級CPU的桂冠,雖然英特爾也屢次迅速反應,重返性能寶座,但比Zen老得多的酷睿架構卻逐漸露出了疲態(tài)。這一次的新架構銳龍將更加難以應對,甚至已經展現(xiàn)出了長期霸占王座的能力。

在第二代銳龍推出時,很多人就在質疑為何不采用改進更大的Zen 2架構,而是漸改架構Zen+。而在第三代銳龍現(xiàn)身后,這一問題終于有了答案。很明顯,Zen 2在設計時就已經考慮到使用更先進的7nm制程,不僅提升核心效率,而且還結合新一代InfinityFabric互聯(lián)總線技術,實現(xiàn)了更靈活的模塊化配置。

針對核心效率,Zen 2架構的主要改進包括分支預測改進、整數(shù)吞吐提升、浮點模塊翻番、內存延遲降低、三級緩存容量翻番、頻率大幅提高等,將代表核心效率的IPC(每時鐘周期指令數(shù))再次提升了15%,單線程性能提升了多達21%。在消費級市場中,核心效率的提升主要表現(xiàn)在游戲能力方面,同樣是8核心16線程,銳龍73800X相比于銳龍7 2700X,在主流游戲大作的幀速中可以提升少則10%、多則34%以上。而在之前的Zen、Zen+核心效率已經接近英特爾酷睿的情況下,這一次的效率提升實際上也讓銳龍的單核性能達到了與酷睿并駕齊驅的水平。在已經公布的很多測試中,第三代銳龍從單核到多核,也都確實表現(xiàn)出了與對手同等甚至更高的能力。

不過作為通用性極高的計算單元,它是否能在很多針對英特爾優(yōu)化的軟件中有更好的表現(xiàn),或者獲得廠商的承認,同樣進行足夠的優(yōu)化,我們尚未可知,而在這方面,近期的一個例子就是最新版的Windows10終于修正了一個針對銳龍CPU的Bug,使得銳龍CPU的效率,特別是多核效率有了明顯提升。雖然這一示例對用戶來說是積極的,但在初代銳龍已經上市兩年多之后才修正了這樣的Bug,也說明AMD的廠商優(yōu)化之路仍然很長。

除了核心效率的提升之外,Zen 2的多芯片設計也更加靈活。毋庸諱言的是,7nm制程在目前仍然是比較困難的,而且對很多芯片來說也是并無必要的技術,所以第三代銳龍采用了I/O部分與CPU分開的設計(圖2),在I/O部分中仍然使用12nm制造工藝,也就是所謂的hiplet多芯片設計,或者說是俗稱的“膠水”芯片。不過這一設計還是相當實用的,除了降低核心規(guī)模、提升良品率外,還可以更加靈活地組合CPU模塊,構成更多核心,甚至升級為超多核心的霄龍(EPYC)CPU。

為了保證這樣的多芯片設計不會影響整體性能,AMD還使用了第二代InfinityFabric總線,提升模塊之間的通信帶寬,降低響應延遲。它提升了帶寬,采用總線頻率、內存頻率分離式設計,單位功耗降低了27%,可支持PCle 4.0標準,特別是為消費級CPU應用進行了優(yōu)化(圖3)。

第三代銳龍的基礎模塊仍然是合有4個物理核心的CCX(CPU Complex),兩個CCX組成一個CCD (CPU ComplexDie)獨立芯片。其中每個CCX的共用三級緩存增加至16MB,比第二代銳龍翻番,一級緩存也進行了調整以提高效率。不過在大幅度增加緩存的情況下,得益于新架構和新工藝,三代銳龍的每個CCX模塊面積卻從二代銳龍的60平方毫米縮小為31.3平方毫米,有利于在同樣封裝下集成更多核心(圖4)。

單獨的I/O Die集成了輸入輸出控制中心、一體化內存控制器。每個CCD有各自的InfinityFabric PHY物理層,可直連I/O Die芯片內的數(shù)據(jù)總線( Data Fabric)。不過各個CCD芯片之間沒有直接通道,通信必須經過I/O Die,這樣可以保證不同核心、緩存之間的延遲是一致的,讓多線程性能提升幾乎達到了完全的線性。

Zen架構的內存延遲是比較明顯的,也一直是為人詬病且影響性能提升的問題。在第三代銳龍中,內存延遲大幅降低,加上支持更高的DDR4內存頻率、翻倍的三級緩存、更準確的分支預測能力,使其性能有了明顯提升。

此外第三代銳龍在計算單元的設置、微指令、操作方式等方面也進行了改進,并且支持單操作AVX-256、更快的虛擬化安全、硬件增強安全防御等等,CPU模塊設計和操作方式上進行了全面強化和革新。最后,Zen 2作為新的架構,在設計中就已經考慮到從硬件層面避免Meltdown、Spectre等CPU架構漏洞,所以基于這一架構的第三代銳龍也就成了一款相對安全且無需任何底層系統(tǒng)補丁,不會因此造成性能損失的CPU。

在市場方面,第三代銳龍的出現(xiàn)在高低兩方面對市場的推動最為明顯。低端方面將主流平臺的起始標準拉到了6核心12線程,這已經超過了數(shù)年前的高端CPU,讓主流機型的應用能力大幅提升。而在高端CPU中,它提供的12核心24線程配置則達到了之前專業(yè)級CPU的水平,在消費級電腦中運行專業(yè)軟件會成為很平常的事。

當然,這樣的設計會進一步推動對手的CPU不斷增加核心/線程,同時消費級應用軟件的多線程利用率也必須提升,才能適應CPU的發(fā)展趨勢。

AMD?Navi核心 意料之外的新架構

基于7nm新工藝的AMD Navi核心一直被認為仍繼承GCN架構,因此很多人對其性能也就不太看好。不過隨著它的正式公布,全新的RDNA架構(圖5)突然出現(xiàn)在世人面前,隨之而來的還有出乎很多人預料的性能。

要知道,隨著GPU架構日益復雜,現(xiàn)在設計一個新的GPU架構甚至要比設計一個新的CPU架構還要難,本次的RDNA架構就花費了長達四年的時間進行研發(fā)。它仍采用統(tǒng)一著色器方式,但標量和矢量單元走向融合,支持SIMT(單指令多線程)、ILP(指令集并行)、SlMD(單指令多數(shù)據(jù)流),使得單線程性能和指令集執(zhí)行效率都大大提升。它同時集成了GCN架構的指令以保持向下兼容,所以很多基于GCN的技術和優(yōu)化設計在RDNA架構上也可以得到支持。

已經公布的Radeon R×5700/5700XT(圖6)采用的是Navi10核心,集成了103億個晶體管,比Vega 64的125億個少了大約18%,核心面積更是小了近一半,只有251平方毫米,但性能卻比Vega 64提升了14%,同時功耗降低了23%,因此單位面積性能提升了足足1.3倍,能效比則提升了50%(圖7)。

除了RDNA新架構,Navi核心還有支持GDDR6顯存、PCle 4.0總線、Radeon媒體引擎、Radeon顯示引擎等全新特性。不過它卻沒有內置硬件光線追蹤引擎,這也說明了GPU開發(fā)的復雜性,畢竟在4年前預測現(xiàn)在的游戲引擎需求是非常困難的事情。

RDNA架構的設計理念主要有四個方面,性能上要滿足現(xiàn)代游戲的需求,能效上要充分優(yōu)化功耗和帶寬利用率,功能上要壯大生態(tài),擴展性上要從移動到桌面到云端通吃。為實現(xiàn)上述目標,RDNA架構主要從CU計算單元、緩存、流水線三大方面進行了變革。

以目前已經公布的Navi10核心為例,它擁有40組新型計算單元,每組有2個標量處理器、64個流處理器、4個64位雙線性過濾單元。雖然每一組的流處理器數(shù)量沒有變化,但執(zhí)行延遲更低,單線程性能更強,緩存效率更高,整體計算能效比GCN架構有著巨大的提升。從實際游戲測試看,RX 5700(圖8)和RX5700 XT(圖9)相對于類似價位的對手,在游戲性能方面都擁有比較明顯的優(yōu)勢。

RDNA的整個圖形引擎也作了重新調整,更加順暢高效,包括幾何引擎、64個紋理單元、4個異步計算引擎(ACE),負載分配更加均衡,可以在更低的功耗下達成更高的頻率,能效比更高。它帶有位于不同模塊的多個零級緩存、512KB一級緩存、4MB二級緩存。多級緩存一致性可以帶來更低的延遲、更高的帶寬、更低的功耗。

RDNA支持Delta數(shù)據(jù)壓縮,可提高傳輸率。它還對色彩壓縮算法進行了改進,不僅可供顯示引擎直接讀取,也能被著色器直接讀寫而無需解壓和重新壓縮。

最后,它在AMD著力推廣的異步計算能力方面也有加強,可以在DX12、Vulkan API下表現(xiàn)更好,更精準地實時控制其他模塊。它還借鑒了Zen架構設計的一些先進理念,比如在時鐘門控方面提升效率和能效比,同時減少了邏輯層級以達到更高的頻率。

在集成顯示輸出和多媒體處理核心方面,它支持HDMI 2.0/DisplayPortl.4,只需一根數(shù)據(jù)線即可輸出最高4K@240Hz、8K@60Hz的畫面。同時它也優(yōu)化了VR頭顯顯示輸出,提供了標準HDR和FreeSync 2 HDR畫面輸出能力,并針對高分辨率HR顯示器進行了優(yōu)化。

RDNA架構集成的Radeon多媒體引擎大大改進了視頻編解碼,增加了新的H.265 HDR/WCG編碼器,全面支持H.264?1080P@600Hz、4K@150Hz、8K@30Hz解碼和1 080P@360Hz、4K@90Hz編碼,H.2651080P@360Hz、4K@90Hz、8K@24Hz解碼和1080P@360Hz、4K@60Hz編碼,VP9 4K@90Hz、8K@24Hz解碼,整體編碼速度加快40%。

雖然目前的第一代RDNA架構沒有專門的硬件光線追蹤加速能力,不過AMD面向專業(yè)應用的ProRender早就提供了RadeonRays光線追蹤功能(圖10),面向內容創(chuàng)作渲染和游戲開發(fā),將其轉移到消費級產品中應該并非不可能。據(jù)稱在下一代RDNA架構上,AMD就會通過硬件單元支持光線追蹤效果,不過AMD認為將其全部交給本地硬件處理的效率低下,未來會更多借助云計算來實現(xiàn)全場景的光線追蹤,這一點與英偉達的DLSS抗鋸齒技術有幾分相似。

除了基于產品自身能力的性能、能耗、功能方面改進之外,RDNA架構還擴展到了移動市場上,授權給三星移動CPU使用,這一新興的市場也許會讓AMD顯示技術獲得更大的發(fā)展。同時AMD GPU也被新一代游戲主機繼續(xù)采用,作為在PC之外的市場獲得了廣泛支持的顯示架構,AMDGPU在未來的跨平臺游戲、云游戲等應用模式中應該能取得一定的先機。

雖然從功耗、特效支持等角度看,第一代RDNA還算不上成熟,但作為第一款使用7nm制程的消費級GPU,它還是給我們帶來了不少新體驗,例如超高的圖像輸出、視頻處理能力等。而對玩家來說,細看其游戲測試就會發(fā)現(xiàn),這是一款已經完全為1440P(2K分辨率)游戲優(yōu)化的GPU和顯卡,會推動這一分辨率成為新的游戲主流設置。這一趨勢也影響到了對手的產品,隨后推出的英偉達RTXSuper系列GPU中,面向最主流用戶的RTX 2060Super就將顯存增加到了更適合1440P分辨率的8GB。

英特爾Ice Lake 管窺未來架構

與前面提到的另外兩款產品不同,英特爾新制程、新架構的lce Lake CPU,或者說是第十代酷睿是面向移動平臺的產品,不僅推出時間更晚,也很可能不會有相應的桌面級產品。所以我們對它的了解,只能說是對英特爾未來架構的一種管窺,希望能夠窺一斑而知全豹,但免不了有所遺漏。

在各種場合介紹lce Lake的同時,英特爾特別強調的一點就是改變定位,它不是獨立的CPU產品,而是英特爾六大技術支柱綜合戰(zhàn)略的一部分。而六大支柱則指的是制程和封裝、架構、內存和存儲、互聯(lián)、安全、軟件(圖11),它們將幫助英特爾從晶體管為中心轉型到數(shù)據(jù)為中心,并且成為未來發(fā)展的基礎。

盡管CPU作為一款產品,在新戰(zhàn)略中的地位有所下降,但它卻仍然是綜合了六大支柱的能力的典型代表。以lce Lake為例,它采用全新的Sunny Cove架構及Gen11核顯(圖12)、10nm制程、支持高達3733MHz的LPDDR4內存和傲騰技術、集成雷電3和Wi-Fi 6,并且進行了安全及軟件優(yōu)化,幾乎涵蓋了六大支柱的所有方面,是一款可以綜合反映英特爾未來戰(zhàn)略的產品。

首先是制程和封裝,僅從14nm再到1 0nm的提升,就使得晶體管密度提升了2.7倍,達到了1億個晶體管/平方毫米,為提升計算能力打下了基礎。而在封裝方面,lceLake也是用了更靈活的I/O控制模塊與CPU模塊分離的設計,并使用了釕等新材料(圖13)。英特爾未來還將引入3D封裝技術Foveros,讓設計人員可以在同一封裝內“混搭”不同的計算單元、存儲芯片和I/O配置功能模塊,甚至其他各種功能模塊,讓芯片架構從二維走向三維,將帶來指數(shù)級的性能和功能增長。

對英特爾來說,架構創(chuàng)新仍然是整體戰(zhàn)略的主要驅動力,其中當然也包括lce Lake使用的SunnyCove架構。在內部計算能力的增強方面,其做法與AMD的Zen 2架構有異曲同工之妙,同樣調整了緩存,將L1緩存增加了50%,L2緩存翻倍,同樣提高了分支預測精度,降低了延遲,也大幅提升了支持的內存頻率。此外Sunny Cove架構的尋址單元從4個增加到5個,執(zhí)行單元接口從8個增加到10個,提高了微架構的并行性能,這顯然也是針對核心規(guī)模不斷增長作出的調整。除此之外,它還提升了一些特定應用的能力,比如通過增加新的AES、SHA-NI指令提高了加解密性能等。所有這些調整的綜合效果使IPC效能增長達到了18%,是自第六代酷睿推出以來最大的性能提升。

不過lce Lake的通用計算能力增長與其核顯的能力增長相比就不算什么了,它采用的核顯升級到了Gen11架構,EU單元從目前Gen 9/10的最高24個提升至64個,在1.1GHz頻率下,浮點性能高達1.12TFLOPS,F(xiàn)P16半精度更是高達2.25TFOPS。在游戲能力方面,它已經可以達到甚至超過銳龍7 3500U內置顯示單元的水平(圖14),可以在全高清分辨率下保證主流網游流暢運行,甚至運行3A大作時也可以達到30FPS以上的速度。

此外,Gen 11核顯在解碼、視頻輸出、垂直同步技術上大幅升級,雙解碼單元支持HEVC、VP9硬解,可使用DPl.4、HDMI 2.Ob接口進行三屏獨立輸出,最高可輸出8K@30Hz、5K@60Hz、4K@120Hz的10-bit畫面,而且還支持AdaptiveSync自適應垂直同步技術,防止高速畫面出現(xiàn)撕裂的問題。

至于存儲方面,LPDDR4-3733MHz內存以及DDR4-3200內存可大幅提升外部數(shù)據(jù)交換能力,并且一舉改變英特爾CPU在內存頻率支持方面的短板。傲騰內存則擁有遠高于一般SSD,更接近DDR4內存的讀寫性能,可以彌補內存與SSD之間的性能鴻溝。

在lce Lake平臺中,40Gbps速率的雷電3接口、近10Gbps的Wi-Fi6無線標準都會成為內置標配。在這個數(shù)據(jù)為王的時代,更快速地連接海量數(shù)據(jù)也將帶給lce Lake巨大的優(yōu)勢。關于這兩個技術及其應用、產品我們已經進行過比較詳細的介紹,這里就不贅述了。

至于軟件優(yōu)化、安全性等方面的表現(xiàn),lceLake及其配套芯片的表現(xiàn)同樣會更加優(yōu)秀。為了簡化開發(fā)者的難度,Intel將推出One API的戰(zhàn)略,可以簡化跨CPU、GPU、FPGA、人工智能加速器等各種計算引擎的編程。該項目包括一個全面、統(tǒng)一的開發(fā)工具組合,以將軟件匹配到能最大限度加速軟件代碼的硬件上。以Al加速為例,使用新的高效率Al指令后,lce LakeCPU的AI性能相比八代酷??商嵘?-2.5倍。

其他

盡管除了CPU平臺和顯卡之外的各種產品,在2019年甚至2020年中并不會有形態(tài)方面的巨大改變,不過一些相關技術、產品卻已經呼之欲出了。在這些新平臺中,PCle 4.0標準、雷電3、USB 4、Wi-Fi 6等技術將會造就更多強大的產品,雖然這些產品進入主流可能尚需時日,但它們對PC使用體驗的提升將是非常巨大的,甚至可能會改變很多PC的傳統(tǒng)應用模式。

以PCle 4.0為例,AMD的第三代銳龍及其X570芯片組將提供帶寬倍增的PCle 4.0通道,同時基于Navi GPU的顯卡也將支持這一標準。雖然從目前來看,主流獨立顯卡對外部帶寬的需求遠沒有達到PCle30的極限,只有目前最強的旗艦級顯卡在組建多顯卡模式(PCle 3.0 x8通道)的時候,才會有外部帶寬不足的問題。不過在顯卡之外,目前另一個PCle通道的主要用戶——M.2 SSD卻已經迫切地呼喚著帶寬的突破了,支持PCle 4.0的SSD主控芯片和相關產品(圖15)已經進行了展示,而傳輸速度則突破了5GB/s,將徹底改變目前數(shù)據(jù)存儲作為PC中最主要“瓶頸”的尷尬地位。

解決目前的瓶頸之后,我們會發(fā)現(xiàn)基于PCle 4.0×4通道的SSD速度已經非常接近內存,那么存儲系統(tǒng)只作為一個數(shù)據(jù)存儲的空間使用就有些浪費了,一些新的應用方式將出現(xiàn)在新的PC中。比如可以將高速SSD融入CPU-內存體系中,讓一些原先易失性的數(shù)據(jù)在SSD上獲得半永久的保存,關機后內存數(shù)據(jù)并不會丟失,下次開機后就能直接進入關機前的運行狀態(tài),例如QQ直接在線、所有工作可繼續(xù)進行等。而在筆記本電腦耗盡電力、臺式機突然斷電的情況下,這一能力更會為用戶帶來前所未有的便利與安全。

這樣的愿景還遠非這次平臺升級帶來的最大變化,因為我們即將迎來的這次PC平臺升級影響將極為深遠,很可能會在20年代帶給我們完全不一樣的PC設計和使用體驗,讓大家進入一個全新的PC時代。

猜你喜歡
制程英特爾內存
外部高速緩存與非易失內存結合的混合內存體系結構特性評測
英特爾攜手一汽集團,引領汽車行業(yè)全新變革
臺積電又推先進制程增強版本N7P和N5P
“春夏秋冬”的內存
英特爾擴充FPGA可編程加速卡產品組合
焊接式軸流風葉的制程與工藝裝備保障
英特爾開源幫霍金“說話”軟件
好平板有強芯 英特爾Bay Trail芯片解析
基于內存的地理信息訪問技術
三星2011年下半推出20nm級制程DRAM