在智能手機領(lǐng)域,Android手機和蘋果iPhone始終是涇渭分明的兩大陣營。就硬件規(guī)格的表面參數(shù)來看,Android手機似乎始終凌駕于iPhone之上。比如iPhone 7 PlUS才用上3GB內(nèi)存,但Android卻用上了6GB甚至8GB;iPhone 7剛用上四核,Android的八核/十核卻早已普及。問題來了,雖然Android陣營參數(shù)層面優(yōu)勢明顯,但在實際的游戲體驗中為何依舊落后于對手?
先從安兔兔排行說起
自從安兔兔推出跨平臺(Android和iOS)的軟件版本之后,綜合排行榜的前兩位就始終被iPhone 6/7和iPhone 6/7Plus所霸占,雷打不動(圖1)。問題來了,以最新的iPhone 7Plus為例,這款手機搭載的A10Fusion只是一顆四核處理器,為什么它的性能卻能超越Android領(lǐng)域的一眾八核/十核處理器?
無論是蘋果、三星、高通、聯(lián)發(fā)科還是海思、松果,所有生產(chǎn)手機處理器芯片的廠商都離不開ARM的授權(quán)。只是,ARM授權(quán)方案分為兩種:
源于自主研發(fā)的實力
第一種是ARM直接授權(quán)設(shè)計好的IP內(nèi)核,比如Cortex-A53、Cortex-A72和Cortex-A73等(圖2),芯片廠拿到IP內(nèi)核授權(quán)后,只要按需選擇核心數(shù)量、互聯(lián)總線、緩存等就能完成CPU部分的設(shè)計。當(dāng)再塞進(jìn)GPU、通訊基帶和電源管理等模塊后就是一個完整的SoC了(圖3)。我們習(xí)慣將這種IP內(nèi)核授權(quán)稱為“公版架構(gòu)”,聯(lián)發(fā)科、海思和松果處理器就都以公版架構(gòu)為主。
第二種是ARM僅授權(quán)指令集,比如ARMv7和ARMv8(圖4),芯片廠拿到這些指令集后,再自行進(jìn)行IP內(nèi)核的設(shè)計,然后才能完成CPU部分的搭建。而這種基于指令集授權(quán)而設(shè)計的內(nèi)核,我們習(xí)慣將其稱為“自主架構(gòu)”。蘋果、高通和三星旗下的頂級處理器就都以自主架構(gòu)為主,比如高通驍龍810/820/835就都采用了自主的Krait(金環(huán)蛇)架構(gòu),三星E×vnos 8890/8895就采用了自主的Monqoose(貓鼬)架構(gòu)(圖5)。
一般來說,能搞自主架構(gòu)的都是更具實力的芯片廠而自主架構(gòu)的CPU核心,在同頻率的性能上都會領(lǐng)先于ARM的公版架構(gòu)。但是,既然是自主研發(fā)的架構(gòu),自然也意味著性能的不對等。至少在與高通Krait和三星Mongoose的較量中,蘋果A10 Fusion(基于ARMv8指令集)就有著性能上的優(yōu)勢。
曾有媒體拿A10 Fusion和驍龍821進(jìn)行了詳盡的對比測試,結(jié)果是A10 Fusion實現(xiàn)了對驍龍821的全程碾壓,特別是CPU性能的領(lǐng)先幅度更是驚人(表1)。
要知道,雖然A10 Fusion和驍龍821都是四核處理器,但二者的運行機制卻有著云泥之別。其中,包括驍龍821在內(nèi)的Android陣營頂級處理器都采用了類似big.LITTLE大小核技術(shù),比如驍龍820就是雙核2.2GHz+雙核1.6GHz,在跑分時四個核心可以協(xié)同作戰(zhàn)(圖7)。
A1 0 Fusion也采用了兩大兩小的結(jié)構(gòu)核心設(shè)計(圖8),兩個高性能核心應(yīng)對高負(fù)載,兩個低性能核心用于日常任務(wù)處理,以此來降低整體功耗,提升續(xù)航能力。但與big.LITTLE技術(shù)不同之處在于,A10 Fusion最多只能同時跑兩個核心,即要么是兩個大核,要么是兩個小核。換句話說,A10 Fusion只靠兩個大核就能超越對手四核、八核或十核的協(xié)同作戰(zhàn),其自主架構(gòu)核心的效率可見一斑。
擴展閱讀
iPhone是何時開始自主研發(fā)的
蘋果在iPhone 4之前都是直接采用芯片廠提供的處理器成品,比如iPhone 3GS搭載的就是三星S5PC100處理器。此后蘋果改變了策略,開始采用ARM指令集授權(quán)、蘋果自行設(shè)計、三星或者臺積電代工的方式來研發(fā)生產(chǎn)(圖6)。所以,iPhone 4之后的歷代iPhone才能在性能上始終保持領(lǐng)先。
GPU緣何一騎絕塵
在Android陣營中,高通驍龍集成的Adreno GPU是性能之王。但是,當(dāng)高通驍龍碰到蘋果A系列處理器后,Adreno GPU卻面臨著被“吊打”的尷尬境遇。原因很簡單,雖然蘋果暫時沒有自主研發(fā)GPU技術(shù),但旗下處理器卻始終牽手Imaginaition(圖9),通過PowerVR系列GPU實現(xiàn)游戲性能的一騎絕塵(表2)。
以蘋果iPhone 7搭載的A10 Fusion處理器為例,它就集成了Imagination PowerVR GT7600 GPU,擁有6個計算核心,即PowerVR GT7600MP6。細(xì)心的讀者肯定發(fā)現(xiàn)了,A10Fusion和A9的GPU型號一樣,但前者的3D性能卻有了明顯的提升。原因是蘋果對A10 Fusion的GPU進(jìn)行了超頻,從而在某些測試場景下實現(xiàn)了相較A9近50%的性能增益。
Android陣營也能用PowerVR GPU
既然蘋果能得到Imagination的授權(quán),高通、三星、聯(lián)發(fā)科、海思、松果為什么不能和Imagination合作?
實際上,除了高通始終堅持自家的Ad reno GPU技術(shù),其他很多芯片廠商也都與lmaqination有過合作。三星早期的蜂烏處理器就以集成PowerVR SGX5系列GPU為榮,聯(lián)發(fā)科在2014年推出的MT6595(集成PowerVRG6200MP2)、201 5年推出的Helio X10(集成PowerVR G6200MP2)以及2017年即將發(fā)布的10nm旗艦Helio X30(集成PowerVR 7XTP-MP4)也都已攜手Imagination。
問題來了,既然聯(lián)發(fā)科MT6595和Helio X10都集成了口碑最好的PowerVR系列GPU,為啥它們的圖形性能別說比不上同期的蘋果A系列處理器了,就連同期的高通驍龍、三星獵戶座集成的GPU也打不過呢?
此時就是體現(xiàn)出芯片廠商底蘊的時刻了。蘋果每一代iPhone的銷量都數(shù)以億計,因此蘋果可以在三星或臺積電手中搶到最新最先進(jìn)的制程工藝資源,同時不計成本地從Imagination簽來最好的獨享的GPU核心,這些都是其他芯片廠商所不具備的底氣。比如MT6595和Helio×10集成的都是Imagination低端級別的PowerVR G6200,而且僅有2個計算核心。而同期的蘋果A7/A8處理器卻用上了更高端的PowerVR GX6430和PowerVR GX6450,而且還配備74個計算核心。性能孰優(yōu)孰劣就不用筆者多說了吧(圖10)?
PowerVR GPU又將進(jìn)化
由于蘋果A系列處理器始終與Imagination保持著聯(lián)姻關(guān)系,所以Imagination每一次GPU技術(shù)革新,自然也意味著下一代iPhone將擁有更為強悍的3D性能。好消息是,前不久Imagination終于發(fā)布了2010年以來的第一個真正全新的GPU架構(gòu),代號“Furian”。
7年以前,Imagination推出的“Roque”架構(gòu)首次引入了統(tǒng)一著色器設(shè)計,PowerVR 6/7/8系列都是基于它衍生來的。只是PowerVR 8現(xiàn)在還沒有被手機處理器所用,業(yè)內(nèi)普遍預(yù)測它將被集成在下一代iPhone 8所用的處理器中。
Imagination最新發(fā)布的“Furian”架構(gòu)是“Rogue”架構(gòu)的升級版,首要目標(biāo)是改進(jìn)功耗和性能,具體來說就是每毫瓦性能、每平方毫米性能,號稱相比于7XTPlUS可提升35%的著色器性能、80%的填充率性能、70%~90%的綜合性能(圖11)。
簡單來說,“Furian”并非從零開始設(shè)計的新架構(gòu),而是在“Rogue”的基礎(chǔ)上翻新而來。它依舊采用了區(qū)塊延遲渲染,但幾乎每個模塊單元、數(shù)據(jù)流、整體布局都是新設(shè)計的,比如支持多線程多任務(wù)數(shù)據(jù)執(zhí)行、微內(nèi)核固件控制、幀緩沖和幾何無損壓縮、新的安全和虛擬化技術(shù)、增強的擴展性、支持還未定案的OpenCL 2.x計算標(biāo)準(zhǔn),全面支持Vulkan、OpenVX等等(圖12)。
此外,“Furian”將每個叢簇的流水線從16級擴展為32級,每時鐘周期的雙線性采樣翻番到8個,同時還改進(jìn)了算術(shù)邏輯單元叢簇(ALU Cluster),原先成對的MAD ALU需要更多資源才能喂飽,但“Furian”卻改用了1個MAD ALU(可做加法和乘法)+1個MUL ALU(只做乘法)的結(jié)構(gòu),從而提升了效率并降低了功耗。
先別急著高興,現(xiàn)在連“Rogue”架構(gòu)的PowerVR 8還沒能商業(yè)化,就別提它的接班人了。只能說“Furian”架構(gòu)是面向未來的,可以滿足7nm工藝、VR游戲、4K超高清、120fps高幀率、HDR高動態(tài)畫面、神經(jīng)網(wǎng)絡(luò)等等的需求。至于基于新架構(gòu)的實際產(chǎn)品,差不多得到2019年的iPhone才有機會嘗鮮了。
但是,蘋果一直都是lmaqination的最大客戶之一,所以未來“Furian”架構(gòu)GPU商業(yè)化時,蘋果A系列處理器還應(yīng)該是首發(fā),繼續(xù)保持對Android陣營處理器的GPU性能壓制。
那么,Android陣營的芯片廠商就沒有辦法了嗎?
Android陣營如何應(yīng)對
答案是當(dāng)然有,那就是緊抱ARM的“大腿”。因為ARM除了提供底層架構(gòu)外,也可捆綁自家的GPU技術(shù)(圖13),也就是我們熟悉的Mali系列GPU。
在Cortex-A57時代,ARM打包的GPU技術(shù)為Mali-T700系列,比如三星獵戶座Exynos 7420(Galaxy S6)集成的就是Mali-T760MP8;到了Cortex-A72時代,ARM打包的GPU升級到了Mali-T800系列,比如聯(lián)發(fā)科HelioX20和麒麟950集成的就是Mall-T880MP4;到了Cortex-A73時代,ARM再次祭出了全新的Mali-G71,比如麒麟960集成的就是Mali-G71MP8。
需要注意的是,ARM每一代的GPU也都會分成不同檔次,比如Mali-T880、T860、T830、T820。而且每個檔次的GPU也能通過塞進(jìn)不同數(shù)量的計算核心進(jìn)一步拉開性能差距。理論上講,Mali系列GPU完全有機會和Imagination展開競爭。
以最新的Mail-G71系列GPU為例,它基于Bifrost微架構(gòu)設(shè)計,ARM允許其核心數(shù)從單核堆積到最高32核(MP32)(圖14)。要知道,麒麟960(Mali-G71MP8)的1生能就接近驍龍821了,而三星即將推出的10nm旗艦處理器Exynos 8895將集成20個核心的Mali-G71 MP20,理論3D性能是麒麟960的2倍多!
如果以后哪款手機處理器能用上Mali-G71 MP32,別說PowerVR8了,估計就連Imagination最新的“Furian”架構(gòu)GPU都能一較長短DR?
競爭結(jié)果取決于整體實力
問題來了,ARM Mali系列GPU的核心數(shù)量可不是想堆就堆的。GPU核心數(shù)量越多,處理器發(fā)熱量和功耗也就越大。在現(xiàn)有的14/16nm工藝下,Mali-G71 M P8已經(jīng)是手機處理器的極限了,而Mali-G71MP20也許則是10nm的極限。想強上Mali-G71M P32?沒有7nm工藝休想鎮(zhèn)壓(或者10nm工藝+散熱風(fēng)扇輔助,反正小身板的手機是駕馭不了的)!
說來說去,手機處理器的競爭最終還是體現(xiàn)在整體實力上。財大氣粗的蘋果,可以自己搞自主處理器架構(gòu),GPU也能從Imagination要來最好的資源,也不怕找不到匹配的晶圓廠代工。所以,Android手機陣營想在整體性能上壓過蘋果,難度還真不是一般的大呢。
好消息是,Android陣營的芯片廠商也一直沒有放棄追趕的腳步。聯(lián)發(fā)科采用的策略是以數(shù)量換質(zhì)量,有消息稱聯(lián)發(fā)科12核處理器已在路上;高通和三星也都在想辦法提升自主架構(gòu)的執(zhí)行效率,縮短與蘋果處理器之間的距離。海思和松果雖然依舊以公版架構(gòu)為主,但這也是為自主架構(gòu)的研發(fā)進(jìn)行的必要(經(jīng)驗)積累。
總之,未來手機處理器之爭,唯有擁有自主架構(gòu)才能顯得越發(fā)從容:每一款智能手機的軟硬件設(shè)計都從底層芯片上開始優(yōu)化,自主架構(gòu)可以讓優(yōu)化進(jìn)行得更為徹底(圖15)。至于想塞進(jìn)更強的GPU,就需要搶占最先進(jìn)的晶圓廠代工,并從ARM或Imagination手中爭取優(yōu)質(zhì)資源了。而想實現(xiàn)上述目標(biāo),足夠的研發(fā)實力和資金支持一個都不能少。
那么,高通、三星、聯(lián)發(fā)科、海思、松果,這些為Android造芯的品牌,你更看好誰呢?