国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Silvermont架構(gòu):英特爾的反攻尖兵

2013-04-29 00:44:03
CHIP新電腦 2013年7期
關(guān)鍵詞:內(nèi)核英特爾指令

彈指一揮間,第一代Atom處理器發(fā)布到如今已經(jīng)整整5年了,5年對(duì)于IT業(yè)界而言是一個(gè)不算短的時(shí)間。不過,Atom處理器卻沒有如英特爾期待的那樣,復(fù)制它的前輩們?cè)谧烂婧凸P記本電腦平臺(tái)上的輝煌:除了在上網(wǎng)本和一體機(jī)流行的時(shí)期有過短暫的驚艷表現(xiàn)之外,大多數(shù)時(shí)間它都糾結(jié)于并不出色的性能、令人難以接受的耗電量和較大的發(fā)熱量之間。它的對(duì)手——ARM架構(gòu)處理器則在新興的智能手機(jī)和平板電腦市場中出盡了風(fēng)頭,甚至把觸手伸向了服務(wù)器領(lǐng)域。

但是平心而論,這5年來Atom處理器的進(jìn)步可謂非常顯著。無論是從晶體管數(shù)量、運(yùn)算能力還是從微架構(gòu)革新等方面來看,Atom處理器的發(fā)展速度都超越了摩爾定律的藩籬,甚至創(chuàng)造了x86處理器的多項(xiàng)“第一”,特別是x86架構(gòu)SoC處理器實(shí)現(xiàn)了可謂革命性的進(jìn)步。

雖然此前英特爾似乎并未把精力過多放在Atom平臺(tái)上,但目前這種情況似乎有所改觀。Sivermont架構(gòu)的Atom處理器有望成為英特爾在低功耗高性能處理器領(lǐng)域扭轉(zhuǎn)乾坤的里程碑。

Silvermont:英特爾的新微架構(gòu)

英特爾5月中旬剛剛發(fā)布了Silvermont微架構(gòu),這也是英特爾寄予厚望、對(duì)抗ARM Cortex A15內(nèi)核的秘密武器。與上一代微架構(gòu)Saltwell相比,Silvermont有著諸多新特性。

全新的亂序執(zhí)行引擎

數(shù)年前的手持移動(dòng)設(shè)備處理器,如ARM Cortex A8內(nèi)核處理器、英特爾早期的Atom(Bonnell)以及高通的Scorpion處理器都采取“順序執(zhí)行”模式。從Coretex A9開始,ARM采用了亂序執(zhí)行的設(shè)計(jì),CoretexA15則采用更優(yōu)化的管線進(jìn)一步提升了性能。針對(duì)這樣的形勢,英特爾將Atom升級(jí)為采用了亂序執(zhí)行引擎的Silvermont微架構(gòu)也順理成章。

與此前的“Saltwell”微架構(gòu)相比,Silvermont微架構(gòu)的執(zhí)行效率更高。前者流水線誤預(yù)測為13個(gè)時(shí)鐘周期,后者則僅為10個(gè)時(shí)鐘周期。不過,英特爾尚未給出Silvermont具體的管線長度。參考Saltwell為16級(jí)管線,大致可以預(yù)測Silvermont的管線在14~17級(jí)之間。與亂序架構(gòu)對(duì)應(yīng),Silvermont對(duì)分支預(yù)測器做出了改進(jìn),增加了一個(gè)間接分支預(yù)測器,這使得指令預(yù)測更加準(zhǔn)確。兩方面的改進(jìn)使得Silvermont比Bonnel/Saltwell的每時(shí)鐘周期指令效率提升了5%~10%。綜合節(jié)能和性能考慮,英特爾在Silvermont微架構(gòu)中仍然采用了雙發(fā)射指令的結(jié)構(gòu)(Cortex A15是3發(fā)射,目前的酷睿微架構(gòu)為4發(fā)射)。

多內(nèi)核和新指令

Silvermont微架構(gòu)最多支持8個(gè)內(nèi)核協(xié)同運(yùn)算。由于目前新一代智能手機(jī)和平板電腦皆已采用四核處理器,因此更新的Silvermont支持到8個(gè)內(nèi)核并不稀奇。考慮到Atom處理器的單個(gè)內(nèi)核運(yùn)算能力基本領(lǐng)先于同一時(shí)代的ARM處理器,所以可以預(yù)見,在今年年底發(fā)布的Silvermont系列處理器將再度奪得性能錦標(biāo)。

Silvermont微架構(gòu)還能夠支持64位運(yùn)算。去年年底英特爾已經(jīng)推出了基于Atom平臺(tái)的64位服務(wù)器芯片S1200,功耗僅為6W。Silvermont微架構(gòu)對(duì)64位運(yùn)算的支持也符合時(shí)代的潮流。除了服務(wù)器的需求外,隨著移動(dòng)設(shè)備運(yùn)算量的增大,64位運(yùn)算的普及也勢在必行。Silvermont微架構(gòu)的競爭對(duì)手之一ARM Cortex A15僅支持32位運(yùn)算,在這方面英特爾仍有一定優(yōu)勢。Silvermont微架構(gòu)還支持SSE 4.1/4.2、POPCNT及AES-NI指令集,彌補(bǔ)了上代產(chǎn)品的缺憾。

新的能效特性

Atom處理器在節(jié)能方面表現(xiàn)不佳是此前它屢戰(zhàn)屢敗的原因之一,不過Silvermont處理器可望摘掉耗能大戶的帽子。在Silvermont出現(xiàn)之前,Atom處理器已經(jīng)支持英特爾的Turbo Boost技術(shù),但它們的表現(xiàn)并不盡如人意。Silvermont微架構(gòu)加入了硬件功耗控制單元,它可以監(jiān)控處理器的發(fā)熱并動(dòng)態(tài)處理SoC芯片內(nèi)各模塊的功耗分配,在處理器溫度允許的范圍內(nèi),運(yùn)行頻率可以得到最大幅度的提升,TDP上限也可被短時(shí)超過。Silvermont也允許對(duì)單一CPU或GPU內(nèi)核加速,從而提升效能。在處理器節(jié)能狀態(tài)方面,Silvermont對(duì)C6狀態(tài)模式進(jìn)行了改進(jìn)。新增加的“CacheRetention”(緩存留置)可使得二級(jí)緩存狀態(tài)介于部分活躍和完全關(guān)閉之間,進(jìn)一步提高了處理器的節(jié)能效果。

制造工藝紅利助推Atom

Tick-Tock策略曾經(jīng)有效地幫助英特爾擺脫了Pentium 4帶來的困境,如今英特爾也把這套策略搬來對(duì)抗ARM。眾所周知,英特爾擁有目前最為先進(jìn)的半導(dǎo)體加工工藝,這使得它在新一代超節(jié)能處理器的競爭中占據(jù)優(yōu)勢。Silvermont微架構(gòu)處理器將會(huì)采用英特爾已經(jīng)成熟的22nm、3D晶體管工藝制造,而目前主流的ARM處理器還都在使用28/32nm工藝。

在每晶體管耗能和漏電率方面,英特爾的22nm工藝占據(jù)著明顯的優(yōu)勢。在工作電壓為1.0V時(shí),22nm工藝處理器比32nm工藝處理器快18%,而在0.7V工作電壓時(shí)快37%,可見僅僅工藝提升就能夠給同功耗的處理器性能帶來將近20%~30%的提高。而用于Atom處理器的22nm工藝很可能還將獲得進(jìn)一步改進(jìn)。借助這些進(jìn)步,Silvermont微架構(gòu)處理器單內(nèi)核運(yùn)行頻率很可能達(dá)到2.5GHz級(jí)別,節(jié)電性也將進(jìn)一步提高。就目前的情況來看,英特爾還將借助工藝優(yōu)勢推行Tick-Tock戰(zhàn)略。目前已經(jīng)可以確認(rèn),英特爾在下一代Atom處理器Airmont中將會(huì)采用14nm工藝生產(chǎn),上市時(shí)間約為2014年下半年。

Atom處理器家族四面開花

基于Silvermont微架構(gòu)衍生的新一代Atom處理器家族,目前已知的處理器有4種,四核的“Bay Trail-T”處理器芯片計(jì)劃用于平板電腦,相關(guān)產(chǎn)品將在2013年圣誕節(jié)購物季推出。據(jù)稱Bay Trail處理器的計(jì)算性能是英特爾目前平板電腦產(chǎn)品的兩倍以上。此外,Bay Trail-M/D平臺(tái)還將用于入門級(jí)筆記本電腦和低端一體式臺(tái)式機(jī)市場,如近來流行的混合模式筆記本電腦等。根據(jù)英特爾方面的資料,與現(xiàn)在的處理器Atom Z2760相比,Bay Trail單線程性能有2~4.7倍的提升,多線程性能有2.5~4.4倍的提升,進(jìn)步相當(dāng)顯著。頻率較低,同時(shí)大幅降低能耗的“Merrifield”將用于智能手機(jī)平臺(tái),據(jù)英特爾表示,它的性能和電池續(xù)航時(shí)間均優(yōu)于當(dāng)前產(chǎn)品,還支持情境感知和個(gè)性化服務(wù)、面向Web流的超高速連接以及更高的數(shù)據(jù)、設(shè)備和隱私保護(hù)等功能。此外,“Avoton”將接替S1200處理器,進(jìn)入數(shù)據(jù)中心內(nèi)的微型服務(wù)器、存儲(chǔ)和擴(kuò)展性負(fù)載。它的特性包括64位指令集、集成結(jié)構(gòu)、錯(cuò)誤代碼校正、英特爾虛擬化技術(shù)以及超強(qiáng)的軟件兼容性等?!癛angeley”則主要針對(duì)網(wǎng)絡(luò)和通信基礎(chǔ)設(shè)施,比如入門級(jí)到中端路由器、交換機(jī)和安全設(shè)備。這兩款產(chǎn)品均計(jì)劃于今年下半年上市。

SoC芯片進(jìn)軍服務(wù)器

早在數(shù)年之前,英特爾萬億次計(jì)算項(xiàng)目取得的成果就已經(jīng)顯示,多個(gè)小內(nèi)核并行組成的處理器有能力進(jìn)行高強(qiáng)度的運(yùn)算,如同一大群螞蟻和大象都有能力搬走一座米山那樣。不過,在面對(duì)一些輕量的需求,如網(wǎng)絡(luò)服務(wù)請(qǐng)求時(shí),低能耗處理器可能更具備成本的優(yōu)勢。如果將至強(qiáng)處理器比作大象的話,那么目前的超節(jié)能處理器就是螞蟻。盡管大象力氣大,但每次需要運(yùn)載的重量可能都遠(yuǎn)不及大象的承載力,很多能量被白白消耗;而螞蟻盡管每次只能扛起一粒米,但蟻群可以根據(jù)米粒數(shù)量決定派出螞蟻的數(shù)目,盡可能多地節(jié)約能源。有鑒于此,英特爾和ARM都把微服務(wù)器(面向大量的輕量需求)領(lǐng)域作為自家超節(jié)能處理器的重要發(fā)展方向。

2012年年底,英特爾推出了面向微服務(wù)器的64位Atom處理器S1200,它的TDP僅為6W?;萜展?013年4月份發(fā)布的服務(wù)器Moonshot就采用了這款處理器,該服務(wù)器的目標(biāo)市場為云計(jì)算和軟件定義服務(wù)器領(lǐng)域。惠普表示,Moonshot服務(wù)器能耗降低了89%,體積減少了94%,而且成本也僅為原來的37%。Moonshot可以滿足呈指數(shù)增長態(tài)勢的云計(jì)算需求。只要有10家大型網(wǎng)絡(luò)服務(wù)供應(yīng)商將它們傳統(tǒng)的服務(wù)器換代為Moonshot服務(wù)器,它們每年就能節(jié)省總價(jià)值1.2億美元的能源使用支出,并減少近100萬噸的二氧化碳排放量,相當(dāng)于減少了18萬輛汽車的尾氣排放量。而英特爾聲稱,還有約20家合作伙伴準(zhǔn)備采用Atom處理器。

x86尚需努力

盡管業(yè)界對(duì)英特爾在SoC超節(jié)能處理器領(lǐng)域取得的進(jìn)展給予肯定,但大部分評(píng)論者對(duì)Atom處理器的前景依然表示謹(jǐn)慎。畢竟此前的差距并非一代Silvermont就可以彌補(bǔ),想要在這一領(lǐng)域呼風(fēng)喚雨,英特爾還需要更加努力。而x86集團(tuán)的另一位重要成員AMD目前尚未拿出令人信服的產(chǎn)品,或許注重圖形表現(xiàn)的SoC處理器才是它的關(guān)注所在。

Baytrail:首次磨刀

Baytrail對(duì)英特爾來說,可謂十年磨一劍,除了在制程上首次令A(yù)tom趕上主流PC的22nm外,又是和酷睿微架構(gòu)等價(jià)的Silvermont低功耗微架構(gòu)的首款商業(yè)化產(chǎn)品。該產(chǎn)品融入了Turbo Boost技術(shù),實(shí)現(xiàn)原理與下圖所示的Sandy Bridge架構(gòu)如出一轍,但是它具備更強(qiáng)的單個(gè)核心供電控制技術(shù),在“低”下去的時(shí)候節(jié)能表現(xiàn)將大大提升。

隨著發(fā)展重點(diǎn)從保持30年優(yōu)勢的PC領(lǐng)域轉(zhuǎn)向移動(dòng)計(jì)算領(lǐng)域,英特爾將越來越多的技術(shù)引入移動(dòng)平臺(tái)。如果將Silvermont的發(fā)展軌跡與酷睿微架構(gòu)的產(chǎn)品放在一起對(duì)比,那么明顯可以看到其更新速度更快。在引入日益成熟的22nm工藝之后,移動(dòng)平臺(tái)產(chǎn)品將有望率先引入14nm工藝,光憑制程上的兩代優(yōu)勢,Atom性能及低功耗表現(xiàn)就將大幅領(lǐng)先。

管線周期

Silvermont架構(gòu)和前代的Saltwell架構(gòu)相比,新增的亂序執(zhí)行能力對(duì)管線深度提出了較高要求。為了避免Pentium 4 Willamette架構(gòu)的超長流水線在分支錯(cuò)誤返回浪費(fèi)過多時(shí)鐘周期,英特爾刻意縮減了Silvermont的管線,這也在很大程度上控制了核心發(fā)熱量。

順序執(zhí)行和亂序執(zhí)行

在最為理想的狀態(tài)下,一條指令的執(zhí)行按照如下的步驟進(jìn)行:首先進(jìn)行指令獲取,如果該指令的運(yùn)算對(duì)象已經(jīng)在寄存器中,則指令會(huì)被發(fā)射到合適的功能單元執(zhí)行,并將結(jié)果寫回到寄存器中。但是,如果在當(dāng)前的時(shí)鐘周期下運(yùn)算對(duì)象不在寄存器中(比如在內(nèi)存中),那么處理單元會(huì)消耗一定的時(shí)間來等待它。對(duì)于順序執(zhí)行處理器而言,只有等待到運(yùn)算對(duì)象之后,指令才能夠被繼續(xù)執(zhí)行下去。亂序執(zhí)行則將這段等待的時(shí)間利用起來:指令首先被存入指令緩沖區(qū)。如果運(yùn)算對(duì)象并不在寄存器中,那么后面其他可執(zhí)行的指令將會(huì)被先執(zhí)行,結(jié)果寫入另一個(gè)緩沖區(qū)。等到前面的指令執(zhí)行后,再按照原先的順序?qū)⒅噶顚懭氲郊拇嫫髦小?/p>

很顯然,對(duì)于復(fù)雜和大量的指令,亂序執(zhí)行的效率更高,但也需要處理器有更強(qiáng)的運(yùn)算能力,這通常意味著會(huì)消耗更多的能源。因此,究竟采用順序執(zhí)行管線還是亂序執(zhí)行管線,歸根結(jié)底要取決于設(shè)計(jì)者對(duì)運(yùn)算能力和能耗的平衡。早期ARM和Atom處理器出于對(duì)能耗的嚴(yán)苛要求,均設(shè)計(jì)為順序執(zhí)行,但隨著人們對(duì)移動(dòng)平臺(tái)運(yùn)算能力要求大幅度提高以及半導(dǎo)體工藝不斷改進(jìn),亂序執(zhí)行處理器逐漸成為寵兒。

聲音

“通過我們的設(shè)計(jì)與制程技術(shù)的共同優(yōu)化,Silvermont已經(jīng)超出了我們預(yù)期的目標(biāo)。借助我們?cè)谖⒓軜?gòu)開發(fā)領(lǐng)域的專長以及領(lǐng)先的制程技術(shù),我們提供的技術(shù)包能夠顯著地提升性能和能效,同時(shí)具備更高的頻率。我們?yōu)榇顺删蜕罡凶院溃?jiān)信Silvermont將為各種全新的低功耗英特爾系統(tǒng)芯片奠定強(qiáng)大而靈活的基石?!?/p>

——Belli Kuttanna 英特爾院士兼首席架構(gòu)師

猜你喜歡
內(nèi)核英特爾指令
聽我指令:大催眠術(shù)
萬物皆可IP的時(shí)代,我們當(dāng)夯實(shí)的IP內(nèi)核是什么?
強(qiáng)化『高新』內(nèi)核 打造農(nóng)業(yè)『硅谷』
英特爾攜手一汽集團(tuán),引領(lǐng)汽車行業(yè)全新變革
基于嵌入式Linux內(nèi)核的自恢復(fù)設(shè)計(jì)
Linux內(nèi)核mmap保護(hù)機(jī)制研究
ARINC661顯控指令快速驗(yàn)證方法
LED照明產(chǎn)品歐盟ErP指令要求解讀
電子測試(2018年18期)2018-11-14 02:30:34
英特爾擴(kuò)充FPGA可編程加速卡產(chǎn)品組合
外資力薦高通并購賽靈思對(duì)抗英特爾
電子世界(2015年22期)2015-12-29 02:49:41
象州县| 罗山县| 壶关县| 农安县| 安徽省| 满洲里市| 巴里| 墨竹工卡县| 吉林市| 延川县| 获嘉县| 乌恰县| 嫩江县| 从化市| 清新县| 边坝县| 百色市| 化州市| 繁昌县| 竹溪县| 鹰潭市| 台前县| 上杭县| 屏东市| 琼结县| 宣城市| 克山县| 龙胜| 巴南区| 双辽市| 丹寨县| 沭阳县| 嵩明县| 乐亭县| 南召县| 固镇县| 成武县| 盈江县| 芜湖市| 诏安县| 双城市|