馬文方
8月24日,在硅谷舉辦的微處理器專業(yè)會議Hot Chips 2015上,甲骨文披露了與甲骨文最新的高端處理器SPARC M7同一架構(gòu)的Sonoma處理器。一年前M7處理器的細(xì)節(jié)也是在Hot Chips會議上披露的。
雖說Sonoma定位在系統(tǒng)橫向擴展(Scale Out),與縱向擴展(Scale Up)的M7相比,相對低端了一些,但是Sonoma與M7一樣采用的都是甲骨文最新的第四代SPARC內(nèi)核,只是內(nèi)核數(shù)量不及M7多罷了。但是,Sonoma集成的InfiniBand控制器,使得集群系統(tǒng)內(nèi)各節(jié)點之間的直連成為可能??梢韵胂螅?dāng)Sonoma出現(xiàn)在數(shù)據(jù)中心市場,或者說云計算市場上時,用戶應(yīng)該會感受到它在性能上的奢華。
“左鄰右舍”都要優(yōu)化
2009年,甲骨文以74億美元收購Sun時,很多人還不大理解:作為數(shù)據(jù)庫廠商的甲骨文,買這么多硬件干什么?
這還要從Sun說起。從1987年Sun推出首個RISC架構(gòu)的SPARC處理器Sun-4算起,SPARC處理器已經(jīng)走過了28個年頭。1993年支持64路SMP(對稱多處理)服務(wù)器的SuperSPARC處理器和1995年64位UltraSPARC處理器的相繼問世,使得Sun成為高端的SMP UNIX服務(wù)器廠商,也讓Sun在隨后的.com熱潮中,一度幾乎占據(jù)了全球高端服務(wù)器市場的半壁江山。
伴隨著.com泡沫的破滅,投資回報率成為CIO甚至CEO關(guān)心的問題。加之,英特爾以廉價的x86芯片從由低向高地蠶食著Unix服務(wù)器市場,而IBM、惠普也在Unix高端市場動作頻頻,腹背受敵的Sun每況愈下。但瘦死的駱駝比馬大,作為一個技術(shù)驅(qū)動型的企業(yè),Sun還是有不少寶貝的:Java、Solaris操作系統(tǒng)、服務(wù)器、存儲和SPARC處理器等。
直到2012年甲骨文推出集成系統(tǒng)(一體機),甲骨文并購Sun的原因才浮出水面。一體機將存儲、服務(wù)器、虛擬機、操作系統(tǒng)、數(shù)據(jù)庫、中間件和應(yīng)用垂直整合在一起,從而將技術(shù)的復(fù)雜性完全屏蔽在廠商一側(cè),進(jìn)而為用戶帶來最佳的應(yīng)用體驗。
甲骨文將其垂直整合過程稱之為工程優(yōu)化,即上述各個層面在研發(fā)階段就相互優(yōu)化,從而使得一體機系統(tǒng)在交付到用戶之前,就已實現(xiàn)了整個系統(tǒng)的最優(yōu)化。
盡管這種層與層之間左鄰右舍式的優(yōu)化,已經(jīng)明顯地改善了系統(tǒng)的性能。但是,一個系統(tǒng)的徹底優(yōu)化不僅需要“近鄰”,還需要“遠(yuǎn)親”。而具有橫跨多個層面進(jìn)行優(yōu)化能力的,唯有處理器。
在處理器的演化過程中,提升主頻、多線程、多核等技術(shù)不斷地為各種軟件應(yīng)用提供了更高的性能,而浮點運算、多媒體指令集等技術(shù)則是基于特定的軟件應(yīng)用進(jìn)行優(yōu)化的。
處理器加速才是王道
被甲骨文收購后,SPARC處理器對企業(yè)級軟件應(yīng)用的加速,主要有兩個途徑:一是提高自身計算性能,二是通過硬件加速的方式對應(yīng)用加速。
不斷提高計算性能是任何處理器廠商在市場上“混”的前提。因為有了“每24個月芯片上的集成度提高1倍”的摩爾定律,人們很容易理解處理器性能不斷提高中的“不斷”二字的意思,市場也“不斷”有新的處理器產(chǎn)品出現(xiàn)。人們會注意到時間軸(X軸)上新的芯片周期性地出現(xiàn),但卻往往忽略了性能軸(Y軸)幅度的增量。
英特爾“奇數(shù)年提升芯片制程技術(shù),偶數(shù)年提升架構(gòu)”的“鐘擺戰(zhàn)略”已經(jīng)耳熟能詳,殊不知,SPARC處理器也采用每兩年對處理器進(jìn)行更新?lián)Q代的策略。由于甲骨文掌門人埃里森堅持不對友商講客套話的風(fēng)格,甲骨文在2014年公布的SPARC發(fā)展藍(lán)圖上,給出了到2019年,甲骨文3次更新SPARC處理器的時間表,而且還給出了每次主要的創(chuàng)新點。在企業(yè)級市場上,無論是英特爾還是IBM的處理器發(fā)展路線圖都沒有畫到2019年。而且,甲骨文還公開挑釁地強調(diào),英特爾x86架構(gòu)或IBM Power架構(gòu)的升級對性能的貢獻(xiàn)為30%~50%,而SPARC架構(gòu)卻達(dá)到100%,而且這種增速還將線性保持下去。
再從硬件加速上看,這在客戶級市場已經(jīng)不是新鮮事,比如說PC發(fā)展初期,80386處理器的用戶做浮點運算只有兩種途徑:一是通過軟件算法,二是購買80387數(shù)學(xué)協(xié)處理器。軟件算法省錢但費時,而協(xié)處理器省時卻費錢。到了80486時,英特爾用浮點計算指令擴展了原有的指令集,作為浮點運算硬件加速的協(xié)處理器也就失去了獨立存在的價值。類似的例子還有多媒體指令集。
通常,這樣的處理器基于應(yīng)用進(jìn)行優(yōu)化的例子都發(fā)生在客戶端市場上。但是,伴隨著由于芯片集成度不斷提高而引發(fā)的片上系統(tǒng)(System on Chip,SoC)的興起,將有更多的應(yīng)用加速技術(shù)作為引擎嵌入到處理器中。而且,這一趨勢也已經(jīng)在企業(yè)級計算市場上逐漸浮現(xiàn)。
軟件芯片化
甲骨文收購Sun之后,先是在提高處理器性能上發(fā)力。從2011年到2013年,甲骨文密集發(fā)布了4款處理器,其中包括低端的T4、T5處理器和高端的M5、M6處理器。甲骨文T系列處理器所謂的“低端”只是相對M系列處理器而言。2013年的性能測試結(jié)果顯示,基于T5處理器的服務(wù)器的性能比其他服務(wù)器廠商提供的配置相近的服務(wù)器顯著領(lǐng)先。
在SPARC處理器設(shè)計團(tuán)隊與甲骨文軟件研發(fā)團(tuán)隊磨合后,借助軟件芯片化來大幅度提升應(yīng)用性能的處理器發(fā)展路線越來越清晰。
所謂軟件芯片化就是將常用的軟件算法以加速引擎的方式嵌入到芯片中,當(dāng)算法從內(nèi)存遷移到處理器內(nèi)部后,不僅大幅度提升了應(yīng)用的性能,而且,可以有效地釋放出處理器內(nèi)核的計算性能,進(jìn)而增強了整個應(yīng)用的執(zhí)行速度。
在Hot Chips 2014會議上披露的M7處理器細(xì)節(jié)中,與性能成倍提升相比,軟件芯片化更加引人注目。其中比較重大的創(chuàng)新有:可以極大提高數(shù)據(jù)庫查詢性能的內(nèi)存查詢加速引擎、確保應(yīng)用僅訪問自己的專用內(nèi)存區(qū)的應(yīng)用數(shù)據(jù)、芯片級數(shù)據(jù)安全、100GB/秒的解壓縮加速引擎。值得一提的是,在硬件性能創(chuàng)新方面,M7以極低的延時提供內(nèi)存共享,讓訪問兩臺服務(wù)器內(nèi)存的體驗與訪問本機內(nèi)存差不多。
如果說M7定位是高端的垂直擴展市場,那么Sonoma則面向主流的水平擴展市場,或者說主要是面向基于集群系統(tǒng)的數(shù)據(jù)中心市場。
與M7相比,Sonoma只是在內(nèi)核數(shù)量上做了裁剪,但是在內(nèi)核架構(gòu)上沒有打折扣,都是采用第四代內(nèi)核。為了支持集群應(yīng)用,Sonoma將高速互聯(lián)總線InfiniBand控制器集成到處理器中,此舉不僅可以省去原有的板卡,而且使得直連時延時更短,同時還節(jié)省了空間,降低了成本。
可以想象,Sonoma將攜甲骨文數(shù)據(jù)庫的優(yōu)勢,給未來的企業(yè)級云計算市場,特別是IaaS和PaaS市場帶來不小的沖擊。這也算是替Sun報了當(dāng)年的一箭之仇。