戴寅
在之前的測試中我們已經(jīng)對NVIDIAAdaLovelace架構(gòu)進(jìn)行過全面的解析,這里簡單概括一下重要的技術(shù)亮點。
●NVIDIAAdaLovelace架構(gòu)中全新設(shè)計的流式多處理器具有最高83TFLOPS的著色能力,吞吐量超過上代產(chǎn)品2倍。
●第三代RTCores有效光線追蹤計算能力達(dá)到191TFLOPS,是上代產(chǎn)品的2.8倍。
●第四代TensorCores新增FP8引擎,具有高達(dá)1.32PFlops的張量處理性能,超過上代5倍。
●支持著色器執(zhí)行重排序(SER),通過即時重新安排著色器負(fù)載來提高執(zhí)行效率。SER可為光線追蹤帶來最高3倍的性能提升,整體游戲性能可最高提升25%。
●新增Ada光流加速器帶來2倍的性能提升,使DLSS3能夠預(yù)測場景中幀和幀之間的運(yùn)動變化,讓神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時提高幀率。
●架構(gòu)進(jìn)行大幅改進(jìn),采用TSMC4NNVIDIA定制工藝,此工藝專為GPU優(yōu)化,實現(xiàn)高達(dá)2倍的能效飛躍。
●12GB顯存及以上型號提供雙NVIDIA編碼器(NVENC),可最多縮短一半的視頻導(dǎo)出時間,并提供了對AV1的硬件編碼支持。
作為RTX40系列第三位登場的成員,從核心圖上可以看到,RTX4070Ti換上了規(guī)模更小一點的AD104核心。晶體管數(shù)量從AD103的459億個減少到了358億個,相較于完整的AD103,AD104精簡了一組完整的GPC和一組“不完整”的GPC,因此總共具備5組GPC。
RTX4070Ti擁有30組TPC,比RTX4080少了8組,CUDA核心從4080的9728個縮減到了7680個,綜合來看它擁有了RTX4080近8成的核心規(guī)模,理論性能定位其實也比較清晰了。此外,RTX4070Ti擁有80個光柵單元,雖說比RTX3070Ti少16個,但它還具備60個第三代光追單元和240個第四代張量單元,比RTX3070Ti多出不少。
RTX4070Ti同樣也采用TSMC4NNVIDIA定制工藝,GPU加速頻率可以達(dá)到2610MHz(公版),游戲加速頻率則更高。顯存部分用上了12GBGDDR6X,比RTX3070Ti要多4GB。顯存位寬為192bit,雖說低于RTX3070Ti的256bit,但它的二級緩存有48MB,是RTX3070Ti的12倍,同時顯存頻率也要高一些,所以綜合計算下來的顯存實際工作效率反而更高。
功率部分,RTX4070Ti的整卡功率為285W,比RTX3070Ti低了5W。官方表示,RTX4070Ti的平均游戲功率其實只有225W左右。官方測試成績表明,得益于NVIDIAAdaLovelace架構(gòu)創(chuàng)新和NVIDIADLSS3,RTX4070Ti在1440P分辨率的Cyberpunk2077withOverdrivemode等游戲中,比RTX3090Ti最高可以快3倍,而功耗只有RTX3090Ti的一半,可見RTX40這一代的能效比非常高。
RTX4070Ti沒有FE公版,所以本次首發(fā)測評使用的是七彩虹戰(zhàn)斧GeForceRTX4070Ti豪華版。該顯卡整體非常方正硬朗,全新的造型結(jié)構(gòu)搭配撞色設(shè)計,詮釋出十足的硬派風(fēng)。散熱裝甲上紅色的鉆石三角元素進(jìn)一步增強(qiáng)了整體設(shè)計中的力量感,顯得低調(diào)而又精致。
七彩虹RTX4070Ti戰(zhàn)斧豪華版搭載了全新設(shè)計的利斧散熱器,內(nèi)置了6條6mm回流焊工藝熱管,使得熱管與鰭片間緊密貼合,從而能夠優(yōu)化散熱效能,實現(xiàn)更好的散熱效果。它還配備了3個98mm的大直徑散熱風(fēng)扇,有效提升進(jìn)風(fēng)量和風(fēng)壓,能夠在高負(fù)載場景更好地驅(qū)散熱量。此外,散熱器也沿用了鏤空背板的設(shè)計,更利于通風(fēng),更好地排出廢熱。
七彩虹RTX4070Ti戰(zhàn)斧豪華版配備了12pin+4pin輔助電源接口,包裝盒也附送了一條轉(zhuǎn)接線。接口部分,七彩虹RTX4070Ti戰(zhàn)斧豪華版提供了3個DP1.4接口和1個HDMI2.1接口,可以支持8K/60HzHDR10輸出。
規(guī)格方面,七彩虹RTX4070Ti戰(zhàn)斧豪華版的基礎(chǔ)頻率為2310MHz,Boost頻率為2715MHz,游戲?qū)嶋H頻率會更高。顯存規(guī)格和公版規(guī)格保持一致。
測試平臺
顯卡:七彩虹戰(zhàn)斧GeForceRTX4070Ti豪華版
處理器:酷睿i913900K
內(nèi)存:金士頓DDR5600016GB×2
主板:華碩ROGMAXIMUSZ790HERO
硬盤:WD_BLACKSN8502TB
電源:華碩ROG雷神Ⅱ1200W
操作系統(tǒng):Windows11專業(yè)版22H2
基準(zhǔn)性能測試
首先看看3DMark的GPU得分。在DX11的FireStrikeExtreme項目中,RTX4070Ti得分相比RTX3070Ti高出了9000多分,約55%,提升幅度相當(dāng)可觀。相對RTX4080則有20%左右的差距。DX12的TimeSpy項目中,RTX4070Ti輕松實現(xiàn)23000+的得分,大約是RTX3070Ti的1.54倍,表現(xiàn)比較搶眼。相比RTX4080,則也是有大約18%的差距。在4K分辨率的TimeSpyExtreme中,RTX4070Ti同樣比RTX3070Ti提升50%左右,和RTX4080的差距也依舊是20%,老黃的刀法依舊是比較精準(zhǔn)的。
DX12UltimateAPI的專項測試SpeedWay中,RTX4070Ti相對RTX3070Ti的提升為45%,相比RTX4080則差了24%。
光追性能方面,PortRoyal測試中,RTX4070Ti比RTX3070Ti提升了59%。純光追場景的DXR測試就要明顯一些,幀數(shù)直接翻倍了??梢钥吹剑庾诽匦г蕉?,RTX4070Ti領(lǐng)先RTX3070Ti的幅度越大,甚至相對RTX3070Ti做到了翻倍,當(dāng)然RTX3070Ti顯存僅有8GB在這里確實也造成了一定的瓶頸效應(yīng)。
DLSS3的測試demo中,默認(rèn)為4K/性能模式,RTX4070Ti在開啟DLSS3后幀率達(dá)到原生4K的4.5倍,相比RTX3070Ti開DLSS2的幀速則是2.5倍左右,可見RTX40特有的“光學(xué)多幀生成”功能對幀率的提升效果多么大。在這里也可以看到,RTX3070Ti不開DLSS時只有5幀,應(yīng)該是8GB顯存不夠用了,所以RTX4070Ti升級到12GB確實是很有必要的。
綜合基準(zhǔn)測試得分來看,RTX4070Ti的性能差不多是RTX4080的80%,相比上代同檔次的RTX3070Ti的提升則達(dá)到了50%左右。光看跑分成績的話,RTX4070Ti和RTX3090Ti是在差不多的水平上,和RTX3070Ti的代際提升還是比較明顯,由此可見,如果玩家買了RTX4070Ti,那么一定要在游戲中開啟DLSS3從而獲得成倍的性能提升。
首先看看2K下的表現(xiàn)。RTX4070Ti在該分辨率下相對于RTX3070Ti的提升在27%~59%之間,綜合12款游戲大作的測試成績,RTX4070Ti平均領(lǐng)先RTX3070Ti大約44%,相當(dāng)于RTX4080約83%的水平。當(dāng)我們把分辨率提升到4K之后,RTX4070Ti相對于RTX3070Ti的提升在29%~68%之間,平均則為大約42%,相當(dāng)于RTX4080約79%的水平,這個表現(xiàn)也是達(dá)到了預(yù)期的目標(biāo)。
在部分優(yōu)化比較好、顯存利用率相對較高的游戲中,RTX4070Ti的提升幅度尤其大,例如2K下的《COD19》相對RTX3070Ti提升幅度高達(dá)59%,4K下的《毀滅戰(zhàn)士:永恒》相對RTX3070Ti的提升幅度更是高達(dá)68%。
綜合來看,RTX4070Ti在不開啟光追的極限畫質(zhì)設(shè)置情況下,可以輕松駕馭現(xiàn)有主流游戲大作,2K下保持120fps以上幀率輕而易舉,4K下大部分游戲可以達(dá)到70fps以上、半數(shù)游戲可以過百幀、所有游戲都能達(dá)到60fps以上。整體的提升還是顯而易見的。
接下來看看光追游戲和DLSS2測試的情況。先來看看《古墓麗影:暗影》。之前在4K下不開光追,RTX4070Ti比RTX3070Ti的提升有49%,開啟光追后,提升進(jìn)一步加大到了62%,開啟DLSS2后,更是有高達(dá)78%的提升。即使是在2K下,這個差距也拉大到了59%。考慮到RTX4070Ti的光追單元和張量單元數(shù)量都要多于RTX3070Ti,這應(yīng)該也是一個合理的表現(xiàn)。
《殺手3》中,RTX4070Ti相對于RTX3070Ti的優(yōu)勢也比較大,各分辨率下保持了56%~68%的提升。《地鐵:離去》增強(qiáng)版4K分辨率下,RTX3070Ti不開DLSS只有26fps,即使開啟DLSS2質(zhì)量模式也只有40fps,RTX4070Ti在4K下領(lǐng)先了62%,但也沒到60fps,不過開啟DLSS后就可以跑到65fps。
《看門狗:軍團(tuán)》的硬件要求比較高,因此也是同樣的情況,RTX3070Ti在開啟DLSS的情況下也只有42fps,如果不開則只有25fps,8GB顯存已經(jīng)捉襟見肘了。RTX4070Ti同樣也需要開啟DLSS才能滿足4K下達(dá)到60fps的需求,不過相對RTX3070Ti來說,優(yōu)勢達(dá)到了50%。
《控制》中,4K開啟DLSS下,RTX4070Ti相比RTX3070Ti的提升為40%左右,不開啟DLSS,RTX4070Ti相對于RTX3070Ti的優(yōu)勢就要稍微小一些,4K原生下領(lǐng)先35%?!豆聧u驚魂6》中的表現(xiàn)和《控制》比較接近,4K下RTX4070Ti相對于RTX3070Ti的提升大約為41%。賽車游戲《F12022》中,4K開啟DLSS時RTX4070Ti相對于RTX3070Ti的提升在45%以上。
《我的世界》開啟RTX后就成了硬件殺手,光追地圖默認(rèn)會開DLSS。如果關(guān)閉DLSS,RTX3070Ti就只有25fps了,RTX4070Ti也不過40fps。開啟DLSS情況下,RTX4070Ti可以跑到104fps,相對于RTX3070Ti提升為44%。
最后再來看看一向優(yōu)化良好的《毀滅戰(zhàn)士:永恒》,在這里RTX4070Ti相對于RTX4080有著20%的差距,這個沒有什么意外。但和RTX3070Ti的對比又有新的情況了。2K下,RTX4070Ti相對于RTX3070Ti有著75%的幀數(shù)提升,幅度比較巨大。而RTX3070Ti因為只有8GB顯存,已經(jīng)無法滿足在最高畫質(zhì)下開啟光追時的顯存需求,甚至開啟DLSS也不行??磥?GB顯存對于4K下的次世代3A大作來說,確實有些捉襟見肘了。
總體來看,平均這些游戲的表現(xiàn),在開啟光追后,RTX4070Ti在2K下相對于RTX3070Ti提升為51%,相對于RTX4080落后20%。4K下相對于RTX3070Ti的提升為52%,落后RTX4080為21%。開啟DLSS后,RTX4070Ti相對于RTX3070Ti的提升為52%,和RTX4080的差距則為22%。
如果我們再綜合之前的測試成績和RTX3090Ti做一個對比,那么RTX4070Ti的游戲性能和RTX3090Ti是差不太多的。在2K分辨率下RTX4070Ti完全可以媲美RTX3090Ti,4K下稍稍弱一點,但也在可接受的范圍內(nèi)。整體來看,在光柵游戲和光追游戲以及開啟DLSS2時,差距都非常小。而RTX40系列的一大賣點就是DLSS3,那憑借DLSS3,RTX4070Ti是不是就能完勝RTX3090Ti呢,這次我們也選取了其中幾款進(jìn)行了測試。
DLSS3可以說是RTX40系列的核心功能了,開啟之后能讓游戲幀率得到極大的提升。從測試來看,《賽博朋克2077》在2K超級光追預(yù)設(shè)下,RTX4070Ti開啟DLSS3性能模式后,幀率從48fps暴增至129fps,達(dá)到了RTX3090Ti開DLSS2性能模式的1.6倍。
《生死輪回》中RTX4070Ti開啟DLSS3后可以提升近100fps,RTX3090Ti開DLSS2的話只有124fps,RTX4070Ti在這里的幀速是后者的1.4倍。
《瘟疫傳說:安魂曲》原生2K最高畫質(zhì)下RTX4070Ti能跑到接近100fps,開DLSS3后暴增至195fps,超過原生的2倍。對比RTX3090Ti開DLSS2的性能則是1.37倍。
《光明記憶:無限》開啟DLSS3后,RTX4070Ti能跑到相當(dāng)于原生2K大約2倍的幀率,大概是RTX3090Ti開DLSS2的1.34倍。
《F12022》中,RTX4070Ti原生畫質(zhì)可以跑到接近120fps,開啟DLSS3后幀數(shù)接近翻倍,和RTX3090Ti開啟DLSS2相比則是1.23倍。
在RTX40首發(fā)時,老黃就已經(jīng)宣布將用新推出的RTXRemixMOD平臺翻新經(jīng)典老游戲《傳送門》,給其加入光線追蹤?!秱魉烷T》RTX版是一款全景光追渲染光線的游戲,所以對硬件的要求也是很高的。
如果使用原生渲染,即使只有2K分辨率,RTX4070Ti和RTX3090Ti都只有不到30幀,如果RTX4070Ti開啟DLSS3,那么幀數(shù)可以達(dá)到90幀,而RTX3090Ti開DLSS2則只有48幀左右。
從幾款DLSS3游戲測試可以看到,RTX4070Ti開啟支持“光學(xué)多幀生成”技術(shù)的DLSS3之后,游戲幀率的提升非??鋸?,雖然沒有實現(xiàn)翻倍,也能讓2K光追游戲大作實現(xiàn)100fps以上的流暢幀率,像《賽博朋克2077》《微軟飛行模擬》這樣要求較高的大作更是從幾十幀的普通流暢度直接提升到上百幀的高流暢度,可玩性上了幾個臺階。
延遲方面,雖然補(bǔ)幀可能會帶來一定的延遲,但在DLSS3提供的高幀率+Reflex技術(shù)的支持下,延遲方面可以得到很好的解決。從實測來看,在開啟DLSS3后,游戲?qū)嶋H延遲都是低于原生畫質(zhì)下的延遲,操作方面玩家們也完全不用擔(dān)心延遲問題。
接下來看看生產(chǎn)力方面的表現(xiàn)。BlenderBenchmark3.3中,RTX4070Ti相對RTX3070Ti提升比較明顯,其中monster和classroom的性能接近RTX3070Ti的1.9倍和1.8倍,junkshop也有40%的提升。
RTX4070Ti在V-Ray中的表現(xiàn)也比較不錯,無論是使用RTX還是CUDA相對于RTX3070Ti都能實現(xiàn)50%以上的渲染效率提升。而OC渲染器中的性能提升則是57%以上。由于RTX4070Ti有12GB內(nèi)存,所以其在3D渲染中的生產(chǎn)力性能自然比8GB的RTX3070Ti更好。
達(dá)芬奇中做MagicMask魔法遮罩時RTX4070Ti的效率提升也非常明顯,RTX3070Ti需要近43秒完成的工作RTX4070Ti只要27秒就可以搞定。
AV1編碼方面,我們依舊選用達(dá)芬奇轉(zhuǎn)碼輸出一段Prores422HQ的視頻,RTX4070Ti和大哥RTX4080區(qū)別不大,而具備雙編碼器的它相對RTX3070Ti來說在H265的轉(zhuǎn)碼測試中卻真的有成倍的效率提升。
總的來說,如果不考慮顯存容量,其實RTX4070Ti的單卡生產(chǎn)力性能是超越RTX3080Ti且可以比肩RTX3090Ti的。再考慮到CUDA與NVIDIASTUDIO生態(tài)圈在業(yè)界無可匹敵的地位,RTX4070Ti也非常值得設(shè)計師用戶選擇。
功耗方面,由于采用了新的TSMC4NNVIDIA定制工藝,使得RTX40系列GPU有著更好的能耗比,在實現(xiàn)相同甚至更高的性能時,功耗更低。這使得RTX40系列出現(xiàn)了一個有趣的現(xiàn)象,那就是游戲功耗基本上都跑不到標(biāo)稱的TGP功耗。其實這是因為TGP功耗是GPU運(yùn)行在Boost狀態(tài)下的上限限制,簡單來說就是功耗墻上限,并不是指GPU滿載時必須達(dá)到的功耗。
RTX40系列GPU跑到TGP功耗上限前,頻率或電壓可能就已經(jīng)達(dá)到了上限,所以它無需更高的功耗才能滿足性能釋放需求。而在上一代Ampere架構(gòu)的GPU上,通常就需要跑到極限功耗才能完成最高性能釋放。從而造成了RTX40系列GPU總是跑不滿功耗的錯覺,實際上這是因為能耗比提升,無需更高功耗。
我們使用NVIDIAFramView工具監(jiān)測了一下RTX4070Ti在一些游戲2K分辨率下的功耗表現(xiàn),可以看到在這些游戲中的平均功耗都沒有達(dá)到285W的TGP功耗。如果我們簡單計算一下,以《荒野大鏢客:救贖2》為例,在該游戲中RTX4070Ti的幀速和RTX3090Ti表現(xiàn)差不多,但功耗只有后者的50%左右。這樣可以計算出在該游戲中RTX4070Ti的能耗比達(dá)到了RTX3090Ti的2倍以上,可以說是表現(xiàn)非常出色了。如果在支持DLSS3的游戲中,那能耗比表現(xiàn)將會更加夸張。
溫度方面其實完全沒有什么可擔(dān)心的,畢竟RTX4070Ti的TGP功耗也只有285W,而游戲?qū)嶋H功耗就更低了。在七彩虹RTX4070Ti戰(zhàn)斧豪華版這套散熱器的加持下,我們可以看到考機(jī)溫度最高僅為62℃,熱點溫度也才72℃左右,玩家完全不用擔(dān)心溫度問題。新的TSMC4NNVIDIA定制工藝帶來的能效比提升確實是相當(dāng)可觀的。
使用NVIDIAAdaLovelace架構(gòu)的RTX40系列GPU有著近乎革命性的進(jìn)步,TSMC4NNVIDIA定制工藝的加入,為其帶來了極高的能耗比。DLSS3技術(shù)帶來了開創(chuàng)性的光學(xué)多幀生成技術(shù),在大幅增加游戲幀率的同時還降低了延遲,為未來AI計算與GPU發(fā)展探索了新的道路。
RTX4070Ti作為RTX40系列第三位登場的成員,從實測來看可以讓大部分3A大作在2K分辨率最高畫質(zhì)下以超過120fps的高幀率運(yùn)行,即使在4K分辨率也能獲得60fps以上的流暢體驗,如果開啟DLSS,那么幀率將再次拔高,帶來更好的游戲體驗。特別是在支持DLSS3的游戲中幀率更是能獲得成倍的提升,甚至可以輕松超越上代旗艦RTX3090Ti。
由于DLSS3技術(shù)有著非常不錯的兼容性,同時也能方便地集成到游戲中,所以在短短幾個月中,已經(jīng)有數(shù)十款游戲支持或即將支持DLSS3,隨著RTX40系列新GPU的不斷發(fā)布,玩家們也將看到DLSS3應(yīng)用在更多的游戲中。此外,從測試中可以看到,8GB顯存在應(yīng)對4K分辨率高畫質(zhì)3A大作時,已經(jīng)捉襟見肘,RTX4070Ti所配備的12GB顯存則能帶來更好的高分辨率游戲體驗。
生產(chǎn)力方面,RTX4070Ti在3D渲染輸出與視頻剪輯方面即使面對RTX3090Ti也毫不示弱。由于12GB及以上顯存的RTX40系列GPU都配備了雙編碼器,所以其在視頻編碼性能方面甚至做到了翻倍,新加入的AV1編解碼功能,對于次世代視頻制作、直播和流媒體觀看等也有著非常重要的意義。
在性能大幅提升的同時,RTX4070Ti同樣為我們帶來了能耗比上驚喜的表現(xiàn),雖然TGP功耗為285W,和上代RTX3070Ti差不多,但其實際游戲中的功耗多在225W左右,表現(xiàn)讓人驚喜。由于在游戲?qū)崪y中,RTX4070Ti的整體表現(xiàn)和RTX3090Ti非常接近,但RTX3090Ti幾乎都是頂著TGP功耗上限在跑,所以即使不算上DLSS3的幀數(shù)提升,RTX4070Ti真的可以算得上相對RTX3090Ti翻倍的能耗比提升了。
我們再看看玩家們非常關(guān)心的價格。從測試中可以看到,RTX4070Ti的性能大約是RTX4080的80%,而其上市建議零售價則為6499元起,相比RTX4080便宜了3000元,大約是RTX4080建議零售價的68%,這樣來看的話,對于中端玩家來說,它的價格更好接受,性價比表現(xiàn)也更高。如果再簡單一點來說,現(xiàn)在只需要6000多塊錢,就能獲得和上代旗艦RTX3090Ti接近的游戲性能,在DLSS3加持下還有更多增幅。
另外,對于想要體驗次世代3A光追大作的玩家來說,GeForceRTX4070Ti也是一個非常不錯的升級好選擇,特別適合之前擁有GTX1080Ti或RTX2080的玩家。根據(jù)官方提供的測試數(shù)據(jù),在DLSS3技術(shù)的加持下,RTX4070Ti相比一代經(jīng)典GTX1080Ti,最高可以帶來12倍性能提升,堪稱夸張了。
因此,對于追求高幀率游戲體驗的玩家和追求高效率的設(shè)計師用戶來講,RTX4070Ti可以算得上是中端價位上一個非常不錯的選擇。