作為Maxwell GPU的先鋒軍,由于工藝的限制,GeForce GTX 750 Ti和GTX 750并沒(méi)有使用20nm的工藝打造,而是較為保守的使用了成熟的28nm工藝。而在架構(gòu)方面,全新的Maxwell架構(gòu)經(jīng)過(guò)了全新的設(shè)計(jì),計(jì)算單元組織方式進(jìn)化為SMM(Sreaming Multiprocessors Maxwell),降低了SM尺寸,提高了SM數(shù)量及調(diào)度邏輯單元數(shù)量,主打每瓦特性能。
Maxwell架構(gòu)首發(fā)的兩個(gè)型號(hào)產(chǎn)品GeForce GTX 750 Ti和GeForce GTX 750均使用了新的GM107核心。這次新核心產(chǎn)品的發(fā)布與之前略有不同,一方面是受20nm工藝拖累,首發(fā)的GM107是一顆偏低端的核心,一改之前首發(fā)旗艦級(jí)核心的做法。另一方面,這兩張新架構(gòu)、新核心的顯示卡也沒(méi)有使用全新的產(chǎn)品序列,仍然和Kepler架構(gòu)產(chǎn)品一起使用GeForce GTX 700系列的命名,這次英偉達(dá)的做法相比之前經(jīng)常舊瓶裝新酒的做法可謂非常厚道。
GeForce GTX 750 Ti和GeForce GTX 750均基于Maxwell架構(gòu)中低端的GM107核心,其中前者使用的是全規(guī)格的核心,擁有640個(gè)CUDA處理器,可搭配1GB或2GB的128bit GDDR5顯存,預(yù)設(shè)頻率1020~1085/5400MHz,官方TDP僅60W;而后者屏蔽了一組SMM,擁有512個(gè)CUDA處理器,搭配1GB 128bit GDDR5顯存,預(yù)設(shè)頻率1020~1085/5000MHz,官方TDP僅55W。為了凸顯低功耗特性,GeForce GTX 750 Ti和GeForce GTX 750公版顯示卡都僅使用了5.75英寸、單槽位的身型,并且更都采用無(wú)外接供電設(shè)計(jì)。
根據(jù)英偉達(dá)的說(shuō)明,GeForce GTX 750 Ti和GeForce GTX 750兩款新品上市(參考售價(jià)999元和799元)后,將會(huì)取代GeForce GTX 650 Ti的地位,下承GeForce GTX 650,上接GeForce GTX 660(GeForce GTX 650 Ti Boost將逐漸退市),并與AMD的R7系列多款顯示卡展開競(jìng)爭(zhēng)。
全新的麥克斯韋1.0架構(gòu)
英偉達(dá)表示,Maxwell架構(gòu)將會(huì)有兩代,用在GeForce GTX 750 Ti和GeForce GTX 750上的GM107核心和只用于移動(dòng)版的GM108核心均采用的是第一代的Maxwell 1.0,以28nm工藝制造,主打低功耗。而Maxwell 2.0,或者是第二代,傳說(shuō)將會(huì)使用20nm工藝打造,會(huì)晚些到來(lái),主打高性能與發(fā)燒友市場(chǎng)。
Maxwell 1.0主打的將是能耗比或者是每瓦特性能,通過(guò)英偉達(dá)之前推出的Tegra處理器和游戲設(shè)備SHIELD就可以看出,英偉達(dá)在原有的傳統(tǒng)游戲PC、工作站及超級(jí)計(jì)算機(jī)領(lǐng)域外,開始拓展一些新的市場(chǎng)。注重低功耗和每瓦特性能的顯示卡,可以應(yīng)用于新晉的、以Mini-ITX為例的小型PC和以Steam Machines為例的游戲主機(jī),在家庭娛樂(lè)市場(chǎng)上進(jìn)一步分一杯羹。
GM107的核心布局與上代相比變化其實(shí)并不大,定位偏低的GM107核心擁有一個(gè)GPC,兩個(gè)64bit顯存控制器及配套的2組ROP單元(每組8個(gè),共計(jì)16個(gè)),外加二級(jí)高速緩存。GPC里仍舊包含一個(gè)光柵引擎(Raster Engine),SM單元的數(shù)量增加為5個(gè),組織方式也使用了全新的設(shè)計(jì)。隨著Fermi、Kepler、Maxwell架構(gòu)的逐步進(jìn)化,GPC里的SM架構(gòu)組織方式也從SM變成了SMX,再變?yōu)槿碌腟MM(Sreaming Multiprocessors Maxwell)。
Maxwell架構(gòu)的SMM,依然和SMX一樣,由PolyMorph引擎(2.0)、CUDA核心、Load/Store單元、SFU、Warp調(diào)度器和分發(fā)單元、Register File、紋理定址/拾取單元、紋理緩存、指令緩存等等組成。最主要的變化是,在PolyMorph引擎(2.0)和指令緩存區(qū)之下,Maxwell架構(gòu)將一個(gè)SM分為4個(gè)獨(dú)立的處理塊,每個(gè)獨(dú)立的處理塊擁有自己的指令緩沖區(qū)、調(diào)度器、32個(gè)CUDA核心,以及Load/Store和SFU單元。之前在Kepler架構(gòu)一個(gè)SMX里的紋理高速緩存和64KB共享顯存/一級(jí)高速顯存組合也發(fā)生了變化,由一對(duì)處理塊共享4個(gè)紋理過(guò)濾單元和一個(gè)紋理高速緩存,然后64KB共享顯存成為獨(dú)立單元,被4個(gè)塊共享。在SMM外,Maxwell架構(gòu)還將核心的二級(jí)高速緩存配置從GK107(同樣是一組GPC、兩組顯存控制器)的256KB大幅提升到了2 048KB,用以降低顯存帶寬需求。
除了全新的布局,控制邏輯分區(qū)、負(fù)荷均衡、時(shí)鐘門控粒度、編譯器調(diào)度、每時(shí)鐘周期發(fā)出指令條數(shù)等方面,Maxwell架構(gòu)也進(jìn)行了改進(jìn)。這樣Maxwell架構(gòu),一改Kepler架構(gòu)的SMX主要大量堆CUDA計(jì)算核心,架構(gòu)效率會(huì)受到一定程度的影響的做法,核心降低了SM尺寸,提高SM數(shù)量及調(diào)度邏輯單元數(shù)量,以達(dá)到簡(jiǎn)化設(shè)計(jì)與調(diào)度邏輯、節(jié)省了面積與功耗、降低計(jì)算延遲的目的。
除了架構(gòu)的革新,Maxwell還有幾點(diǎn)新的變化。首先,Maxwell改進(jìn)了在Kepler上加入的硬件H.264視頻編碼器NVENC,可以實(shí)現(xiàn)更快的編解碼速度(英偉達(dá)稱編碼速度可以提升1.5~2倍,解碼速度提升8~10倍),以服務(wù)于H.264視頻編解碼和自己的特色功能ShadowPlay,游戲視頻實(shí)時(shí)錄制。其次,Maxwell使用了全新的GC5功率狀態(tài),能在視頻播放等輕載型使用場(chǎng)合降低GPU的功耗。除此之外,英偉達(dá)顯示卡一直以來(lái)的一些特性,比如支持PhysX、TXAA、GPU Boost、G-Sync、GeForce Experience等等,Maxwell核心、GeForce GTX 750 Ti和GeForce GTX 750都全部支持。
我們非常驚喜的看到,Maxwell所采用了的全新設(shè)計(jì),一改之前Kepler使用龐大規(guī)模ALU設(shè)計(jì)的SMX,采用新的SMM,讓核心可以更有效的利用每一個(gè)計(jì)算單元,開始走上了追求效率之路。外加Maxwell架構(gòu)在編譯器調(diào)度、每時(shí)鐘周期發(fā)出指令條數(shù)等方面的改進(jìn),以及容量更大的二級(jí)緩存等設(shè)計(jì),使得每個(gè)計(jì)算核心的效率和每瓦特性能都有了顯著增長(zhǎng)。只是受到20nm制程工藝的拖累,我們暫時(shí)只能靠一顆偏低端的核心來(lái)嘗嘗鮮。不過(guò)對(duì)性能有較高要求用戶也無(wú)須著急,高性能Maxwell 2.0產(chǎn)品的出現(xiàn)只是時(shí)間問(wèn)題。