戴寅
采用NVIDIAAdaLovelace架構(gòu)的RTX4090顯卡已經(jīng)開始在市場中銷售,其空前強(qiáng)大的性能獲得了發(fā)燒級玩家的一致追捧。而在9月20日與RTX4090同時發(fā)布的RTX4080,也在約定的時間正式登場。作為RTX40系列目前的次旗艦,RTX4080也具備AdaLovelace架構(gòu)的一系列新特性與黑科技,如第三代RTCores與第四代TensorCores,當(dāng)然也包括可以讓游戲的視覺效果與幀率大幅提升的DLSS3,而價格方面則相對更甜品一些。因此,RTX4080也受到了游戲玩家與高性能用戶的廣泛關(guān)注,而11月15日RTX4080也正式迎來了性能解禁。本次測試我們使用的是來自NVIDIA的GeForceRTX4080FoundersEdition(以下簡稱RTX4080FE),想知道這款原廠信仰級神器到底實力如何?那就和我們一睹為快吧。
之前我們對NVIDIA Ada Lovelace架構(gòu)進(jìn)行過全面的解析,這里先簡單概括一下它的技術(shù)亮點。
●NVIDIA Ada Lovelace架構(gòu)中全新設(shè)計的流式多處理器具有最高 83 TFLOPS 的著色能力,吞吐量超過上代產(chǎn)品2倍。
●第三代 RT Cores 有效光線追蹤計算能力達(dá)到 191 TFLOPS,是上代產(chǎn)品的 2.8 倍。
●第四代 Tensor Cores 新增FP8引擎,具有高達(dá) 1.32 PFlops 的張量處理性能,超過上代 5 倍。
●支持著色器執(zhí)行重排序(SER),通過即時重新安排著色器負(fù)載來提高執(zhí)行效率。SER可為光線追蹤帶來最高3倍的性能提升,整體游戲性能可最高提升 25%。
●新增Ada光流加速器帶來2倍的性能提升,使DLSS 3能夠預(yù)測場景中幀和幀之間的運動變化,讓神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時提高幀率。
●架構(gòu)進(jìn)行大幅改進(jìn),采用TSMC定制4N工藝,此工藝專為GPU優(yōu)化,實現(xiàn)高達(dá)2倍的能效飛躍。
●12GB顯存及以上型號提供雙NVIDIA編碼器(NVENC),可最多縮短一半的視頻導(dǎo)出時間,并提供了對AV1的硬件編碼支持。
著色器執(zhí)行重排序技術(shù)可以帶來更高的效率
GPU在完成大量并行計算的時候效率最高,而隨著游戲中光追效果越來越復(fù)雜,著色器面臨的可能就是大量發(fā)散的、無序的低效率工作任務(wù),從而影響了渲染效率。SER技術(shù)的出現(xiàn),就可以把這些雜亂的工作任務(wù)進(jìn)行分類,動態(tài)重組為更高效的任務(wù),從而提升著色器的執(zhí)行效率。從NVIDIA官方數(shù)據(jù)來看,SER技術(shù)大約會帶來2倍的著色器性能提升。
第三代RT Core 新增了“微映射透明度引擎”和“微網(wǎng)格置換引擎”
從RTX 20到RTX 30再到RTX 40,RT Cores進(jìn)化到了第三代。簡單地從有效光線追蹤計算能力來看,NVIDIA Ada Lovelace 架構(gòu)GPU的第三代RT Cores吞吐量達(dá)到了191 TFLOPS,是上一代的2.8倍之多。
另外,NVIDIA Turing和Ampere 架構(gòu)GPU中的RT Cores包括了用于加速邊界體積層次(BVH)數(shù)據(jù)結(jié)構(gòu)遍歷的加速單元,并執(zhí)行射線三角形和光線邊界框相交測試計算。Ampere的RT Cores中,BVH遍歷由Box Intersection Engine進(jìn)行加速,射線三角形相交測試由三角形相交引擎進(jìn)行加速,這已經(jīng)被證明是迄今為止處理光追工作負(fù)載最高效的引擎。而在Ada GPU的第三代RT Cores中,除了以上兩個功能外,還引入了“微映射透明度引擎”(OMM)和“微網(wǎng)格置換引擎”(DMM)。
微映射透明度引擎的作用是優(yōu)化光線追蹤渲染,大幅降低著色器的工作負(fù)載,這對于處理復(fù)雜物體光追特性來講提升是很大的。具體的原理是將光線追蹤特性烘焙到不透明的蒙版中,讓那些不規(guī)則的形狀與半透明的對象都能更快更精準(zhǔn)地被渲染出來。
微網(wǎng)格置換引擎則可以將面數(shù)非常多的復(fù)雜圖形做簡化,創(chuàng)造出更加簡單的模型,從而實現(xiàn)用基本三角形渲染復(fù)雜幾何圖形的目的,大大減少了計算量和對顯存的占用。從官方數(shù)據(jù)來看,微網(wǎng)格置換引擎可以讓光線追蹤的BVH速度最多提升15倍以上,而顯存占用最多可降低到原先的1/20,總之就是越復(fù)雜的模型,微網(wǎng)格置換引擎的優(yōu)化效果越突出。
在Ada GPU上,Tensor Cores已經(jīng)進(jìn)化到了第四代,而這次Tensor Cores的升級尤其重磅。它配備了全新的FP8引擎,張量處理性能高達(dá)1.32 PetaFlops(相對上代提升了五倍之多)。第四代Tensor Cores最具革命性的進(jìn)步當(dāng)然是全新加入的光流加速器(Optical Flow Accelerator),而它就是NVIDIA DLSS 3黑科技的核心所在。
DLSS3技術(shù)帶來了全新的光學(xué)多幀生成技術(shù)
DLSS技術(shù)作為RTX系列顯卡提升畫質(zhì)與幀率的專用黑科技,到RTX 40這一代進(jìn)化到了DLSS 3,跨度之大證明其改進(jìn)是革命性的,NVIDIA官方稱其代表了“神經(jīng)網(wǎng)絡(luò)渲染新時代”。
和之前的DLSS不同,DLSS 3在原有的超分辨率功能基礎(chǔ)上進(jìn)一步引入了光學(xué)多幀生成技術(shù),簡單來說就是可以通過AI計算生成新的幀,而不像之前那樣只是生成像素。而這個幀生成的工作,是在Ada架構(gòu)中新的光流加速器完成的,當(dāng)然這就意味著DLSS 3中的“光學(xué)多幀生成”功能是RTX 40獨享的。
光流加速器可以在DLSS 2的基礎(chǔ)上計算兩幀之間的光流場,捕捉游戲畫面中從第1幀到第2幀之間變化的方向與速度,包含粒子、光線照射、反射等像素信息,通過計算運動矢量和光流場來精確重建畫面。
實時光學(xué)多幀生成技術(shù)可以直接生成幀而不是單獨的像素
總的來說,DLSS 2做的是通過AI計算出畫面上剩余的像素,而DLSS 3則在此基礎(chǔ)上還能計算出下一幀完整的畫面,這樣算下來DLSS 3等于是完全重建了實際顯示畫面7/8的像素,也可以說是重建了相當(dāng)于實際渲染像素7倍的像素。此外,由于DLSS 3的“幀生成”在GPU中后處理,所以即便是CPU性能出現(xiàn)瓶頸,也能提升游戲幀率。
按照官方數(shù)據(jù),DLSS 3最多可帶來4倍的游戲性能提升。DLSS 3包含了“光學(xué)多幀生成”、“超分辨率”和“NVIDIA Reflex”三大部分,開發(fā)者只要整合DLSS 3,就可默認(rèn)支持DLSS 2。目前DLSS 3已經(jīng)得到了游戲開發(fā)者與游戲引擎的廣泛支持,在后面的詳細(xì)測試中我們會進(jìn)一步介紹DLSS 3游戲的情況。
在生產(chǎn)力方面,NVIDIA GPU打造的CUDA生態(tài)圈已經(jīng)是業(yè)界無可匹敵的存在,RTX顯卡也是設(shè)計師們優(yōu)先考慮的高效工具,因此RTX 40系列配合NVIDIA Studio 驅(qū)動也將會為內(nèi)容創(chuàng)作者們提供更加出色的選擇??偟膩碚f,目前RTX 可以加速 110 多款主流創(chuàng)意應(yīng)用,此外,SDK的提供使這些應(yīng)用更加高效,并提供獨家的功能,例如Optix、DLSS和Maxine。NVIDIA Studio 還提供了全套創(chuàng)意應(yīng)用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
AV1相比H.264等編碼方式可以在同碼率下提供更加清晰的視頻畫面,而且AV1還支持一些更先進(jìn)的編碼特性,例如HDR與低延遲。RTX 40的編碼器(顯存12GB以上的RTX 40系列,當(dāng)然包括RTX 4080,都提供了NVENC A V1雙編碼器)提供了對AV1硬件編碼的支持,而OBS和Discord等推流軟件都將在不久之后提供對NVENC AV1的支持,讓玩家享受到更加精美而流暢的直播視頻畫面。解碼方面,RTX 40的NVENC也繼承了RTX 30上的第5代硬件解碼器,支持MPEG-2、VC-1、H.264(AVCHD)、H.265(HEVC)、VP8/9以及AV1的硬件解碼。AI直播部分,NVIDIA在直播應(yīng)用技術(shù)上的更新有:面部表情預(yù)估、眼神追蹤(讓你看起來像是在看攝像頭),以及虛擬綠幕的質(zhì)量改進(jìn),而開發(fā)者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的這些功能。
那么RTX 4080作為RTX 40系列的次旗艦,規(guī)格如何呢?RTX 4080采用了AD103芯片,AD103相對AD102進(jìn)行了一些削減,GPC為7組,另外其中1個GPC還縮減了2組TPC只有4組。而RTX 4080在此基礎(chǔ)上進(jìn)一步減少了兩組TPC,總共擁有38組TPC。
因此,RTX 4080 GPU具有 9728個CUDA 核心,可提供 49 Shader-TFLOPS 傳統(tǒng)光柵渲染能力;304個第四代Tensor Cores 為AI處理和DLSS提供780 Tensor-TFLOPS的計算性能;76個第三代RT Cores具有113 RT-TFLOPS的計算性能,為下一代光線追蹤提供強(qiáng)勁動力;配備256 bit/16 GB美光GDDR6X顯存。根據(jù)官方數(shù)據(jù)來看,RTX 4080的性能最高可達(dá)RTX 3080 Ti的2倍,而功耗則降低了近10%。當(dāng)然,RTX 4080也具備Ada Lovelace架構(gòu)的多項技術(shù),包括著色器執(zhí)行重排序(SER)、第三代 RT Cores 以及DLSS 3。
此外,細(xì)心的玩家也許注意到RTX 4080的RT Cores/Tensor Cores/TUs數(shù)量甚至要比RTX 3080 Ti少一些,顯存位寬也要低一些,那它是怎么做到性能反而更高的呢?前面已經(jīng)說過了,RTX 4080的SM單元經(jīng)過了進(jìn)一步優(yōu)化且支持SER技術(shù),同時RT Cores與Tensor Cores都要高出一代,效率自然不可同日而語,此外GPU的二級緩存是RTX 3080 Ti的10.7倍,核心頻率更是高出50%以上,綜合這些因素,RTX 4080最終的性能其實是遠(yuǎn)遠(yuǎn)超過RTX 3080 Ti的。而在TGP方面,RTX 4080設(shè)定為320 W,比RTX 3080 Ti還低30 W,可見其先進(jìn)的制程確實帶來了極高的能效比。
完整的AD103 GPU核心圖
RTX 4080 GPU核心圖
NVIDIA的Founders Edition長期以來都是N飯心目中的信仰神器,在工業(yè)設(shè)計方面可以說是獨具特色,除了性能強(qiáng)悍之外也具備極高的收藏價值,而且在電氣性能方面也是眾多AIC廠商的參考標(biāo)桿。
RTX 4080 FE的外觀造型與RTX 4090 FE完全相同,銀色與黑色的搭配相得益彰,顯卡中央的X造型盡顯科技與信仰的力量。散熱器正面有一只軸流風(fēng)扇負(fù)責(zé)推風(fēng),另一只軸流風(fēng)扇位于顯卡背面負(fù)責(zé)拉風(fēng),從而在機(jī)箱中制造出更為高效的散熱風(fēng)道,提升整體的散熱效果。
RTX 4080 FE散熱器也搭載了新的散熱鰭片和氣流設(shè)計,相比上代旗艦的FE散熱器,RTX 4080 FE可產(chǎn)生的最大氣流高出20%,在同噪聲等級情況下,氣流可以高出15%,從而提供更高的散熱效率。
和RTX 4090 FE一樣,RTX 4080 FE的厚度已經(jīng)達(dá)到了3.5槽,重量接近2.2kg,散熱器的體積相當(dāng)?shù)目鋸?,旗艦的霸氣感十足。輔助電源接口當(dāng)然也是12Pin+4Pin,包裝盒也附送了一條12Pin+4Pin轉(zhuǎn)4×8Pin的轉(zhuǎn)接線。在RTX 4080 FE的側(cè)面,配備了GeForce RTX信仰燈,通電后會亮起白光,信仰感爆棚。顯卡尾部設(shè)計了一個磁吸蓋板,打開后會露出機(jī)架安裝孔位,方便在服務(wù)器機(jī)柜中安裝。
接口部分,RTX 4080 FE提供了3個DP 1.4接口和1個HDMI 2.1接口,可以支持8K/60Hz HDR10輸出。
RTX 4080 FE和上代FE一樣采用了異形PCB設(shè)計,整體布局和RTX 4090 FE在細(xì)節(jié)上有些不同,總供電相數(shù)為16,強(qiáng)大的供電設(shè)計可以提供更加平穩(wěn)的高負(fù)載輸出曲線,讓RTX 4080 GPU穩(wěn)定發(fā)揮全部性能。
測試平臺
顯卡:NVIDIA GeForce RTX 4080 Founders Edition
處理器:Intel酷睿i9 13900K
內(nèi)存:金士頓 DDR5 6000 16GB×2
主板:華碩ROG MAXIMUS Z790 HERO
硬盤:WD_BLACK SN850 2TB
電源:華碩ROG雷神Ⅱ 1200W
操作系統(tǒng):Windows 11 專業(yè)版 22H2
測試中我們解鎖處理器功耗墻,并開啟BIOS中的Resize BAR選項。內(nèi)存選擇XMP DDR5 6000模式,分頻設(shè)定為自動。此外,還選用了RTX 3080 Ti與RTX 4090進(jìn)行對比。
首先是3DMark GPU基準(zhǔn)測試部分,不管是基于DX11的FireStrike系列還是基于DX12的TimeSpy系列,RTX 4080都相對RTX 3080 Ti領(lǐng)先了43%~46%。
3DMARK在近期更新了針對DX12 Ultimate的測試SpeedWay,能夠更好地展現(xiàn)次世代GPU在使用DX12U API的次世代游戲中的表現(xiàn)。在這個測試中,RTX 4080相對3080Ti的提升同樣達(dá)到了40%。
光追性能方面,PortRoyal測試中,RTX 4080比RTX 3080Ti提升了39%。在對GPU壓力較大的DXR純光追場景測試中,更是領(lǐng)先RTX 3080 Ti大約55%之多,Ada Lovelace的第三代RT Cores確實在效率方面更勝一籌。
DLSS部分,RTX 4080也保持了巨大的優(yōu)勢,在DLSS 2模式下,也領(lǐng)先RTX 3080 Ti大約45%。在DLSS 3項目中,RTX 3080 Ti不支持光學(xué)多幀生成,所以只相當(dāng)于運行DLSS 2的4K測試,而內(nèi)置光流加速器、完整支持DLSS 3的RTX 4080自然效率更高,領(lǐng)先RTX 3080 Ti大約128%!可謂飛躍式的升級了。同時,我們也可以看到,RTX 4080的基準(zhǔn)性能為RTX 4090的70%~77%,和它的芯片規(guī)模是比較符合的。
光柵化游戲部分,《古墓麗影:暗影》在2K分辨率下,RTX 4080比3080Ti多出了75 fps,提升幅度為44%,在4K分辨率下多出了37 fps,提升達(dá)到了39%。和RTX 4090相比,4K下的性能大約為它的67%。
《COD 19》中,RTX 4080無論在2K還是4K下相對3080Ti都有接近40%的幀率提升,在4K下則大約有RTX 4090的73%,相比《古墓麗影:暗影》表現(xiàn)要好一些。
《荒野大鏢客:救贖2》算是比較公平的游戲,RTX 4080相對RTX 3080 Ti無論在2K還是4K下的提升都超過了30%,4K下的提升略高一點達(dá)到了38%。它在4K下的幀率大約為RTX 4090的76%,差距不算太大。
育碧系游戲《刺客信條:英靈殿》,RTX 4080相對于RTX 3080 Ti同樣在2K和4K下都有30%出頭的優(yōu)勢,而在這里它只比RTX 4090低了15%左右。
《孤島驚魂6》對旗艦顯卡的優(yōu)化也不是很到位,2K下RTX 4080和RTX 4090只有5%的差距,有可能在處理器方面出現(xiàn)瓶頸問題了。而到了4K下,差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的幀率也高出了30%左右。
RTX 3080 Ti跑4K的《看門狗:軍團(tuán)》勉強(qiáng)能到60 fps多一點,而RTX 4080還是能接近90 fps,提升大約有38%。RTX 4080在4K下有RTX 4090大約75%的幀率。
優(yōu)化超好的3A大作《毀滅戰(zhàn)士:永恒》中,RTX 4080在4K下能超過240 fps,雖然RTX 3080 Ti幀率也不低,但是RTX 4080的提升已經(jīng)接近50%了,增幅非??捎^。
同樣有這么大性能差距的游戲還有《殺手3》,RTX 4080在2K和4K下相對RTX 3080 Ti的幀率優(yōu)勢都超過了45%。
RTX 4080在《Control》中的表現(xiàn)相對平淡一些,相比RTX 3080 Ti在4K下大約有28%的幀率優(yōu)勢,相比RTX 4090則落后了29%。
賽車游戲《極限競速:地平線5》,4K下RTX 4080比RTX 3080 Ti多了35%的幀率,比RTX 4090低了18%。2K下的幀率和RTX 4090比較接近,顯然是處理器又出現(xiàn)了瓶頸。
再來看幾款電競網(wǎng)游。玩《絕地求生》的話RTX 4080也能達(dá)到最高畫質(zhì)4K/144Hz的標(biāo)準(zhǔn),在4K下比RTX 3080 Ti高了33%,比RTX 4090低了31%,正好在中間位置。
暴雪的《守望先鋒2》里RTX 4080同樣也能達(dá)成最高畫質(zhì)4K/144Hz的標(biāo)準(zhǔn),相比RTX 3080 Ti在4K下的幀率提升也有34%,而比RTX 4090則是低了29%。
《最終幻想14》的表現(xiàn)則符合之前的差距,RTX 4080相比RTX 3080 Ti提升30%左右,相比RTX 4090在4K下落后26%。
從這這些主流游戲的光柵化游戲性能測試結(jié)果來看,2K下RTX 4080相對于RTX 3080 Ti的提升在24%~50%之間,平均為36%。4K下提升在28%~46%之間,平均也是36%。相比RTX 4090,2K下的平均差距為15%,4K下大約有25%。
當(dāng)然,光追和DLSS才是RTX顯卡真正的精髓,我們當(dāng)然要用極限畫質(zhì)下的光追游戲來考驗RTX 4080的強(qiáng)悍性能。
同樣先來看看《古墓麗影:暗影》。之前在4K下不開光追,RTX 4080比RTX 3080 Ti的提升有39%,開啟光追后,提升進(jìn)一步加大到了43%,雖然光追核心不如RTX 3080 Ti多,但RTX 4080的光追單元畢竟高出一代,同時頻率也高很多,所以性能大幅提升也是情理之中。
《地鐵:離去 增強(qiáng)版》4K下,RTX 3080 Ti不開DLSS已經(jīng)只有35 fps了,即使開啟DLSS質(zhì)量模式也達(dá)不到60 fps。RTX 4080在4K下的優(yōu)勢達(dá)到了49%,開啟DLSS還可以跑到80 fps。
《看門狗:軍團(tuán)》的硬件要求也比較高,也是同樣的情況,RTX 3080 Ti在開啟DLSS的情況下才能勉強(qiáng)達(dá)到4K/60 fps,RTX 4080在4K下有接近40%的優(yōu)勢,開啟DLSS更是可以跑到79 fps。
《Control》中的表現(xiàn)也沒有什么意外,不過在這里RTX 4080相對于RTX 3080 Ti的優(yōu)勢稍微小一些,4K下提升為26%,開啟DLSS后提升為31%。
《孤島驚魂6》再次展現(xiàn)了它對旗艦顯卡的優(yōu)化不足,游戲中2K分辨率下RTX 4080和RTX 4090的幀率居然是一樣的。不過4K下的表現(xiàn)就比較正常了,RTX 4080比RTX 3080 Ti高了27%。
硬件殺手游戲《我的世界》RTX版里,DLSS默認(rèn)就是和光追綁定的,開光追默認(rèn)就開DLSS,如果手動關(guān)掉的話,RTX 3080 Ti就只有36 fps了,不過RTX 4080還是能接近60 fps,提升達(dá)到了50%,如果開啟DLSS的話,優(yōu)勢可以達(dá)到55%。
賽車游戲《F1 22》中,RTX 4080相對于RTX 3080 Ti的提升同樣在30%以上,自己則落后RTX 4090大約25%。
此外,我們還測試了《光明記憶:無限》《毀滅戰(zhàn)士:永恒》《生化危機(jī)8》,在這3款游戲中,開啟光追后RTX 4080相對于RTX 3080 Ti在4K下的提升也都在40%以上。
總體來看,綜合這些游戲的表現(xiàn),在開啟光追后,RTX 4080相對于RTX 3080 Ti的提升大約為40%,達(dá)到了RTX 4090大約72%的性能。開啟DLSS后,RTX 4080相對于RTX 3080 Ti的提升為41%,和RTX 4090的差距大約為26%。
我們知道,DLSS 3是RTX 40系列的重頭戲,它由DLSS 2超分辨率+幀生成+REFLEX三大部分組成。從RTX 4090發(fā)布到現(xiàn)在支持DLSS 3的游戲也越來越多了,這次我們選取了其中幾款進(jìn)行了測試(使用NVIDIA FramView工具監(jiān)測幀率與PCL延遲)。
《賽博朋克2077》在4K超級光追預(yù)設(shè)下,RTX 4080開啟DLSS 3性能模式后,幀速從30 fps暴增至114 fps,如果和RTX 3080 Ti開DLSS 2性能模式相比,則提升了近一倍。
《生死輪回》中RTX 4080開啟DLSS 3后可以提升近100 fps,RTX 3080 Ti開DLSS 2的話只有92 fps,RTX 4080的DLSS 3優(yōu)勢還是比較明顯。
《瘟疫傳說:安魂曲》原生4K最高畫質(zhì)下RTX 4080能跑到接近60 fps,開DLSS 3后暴增至160 fps,接近原生的2.8倍。對比RTX 3080 Ti開DLSS 2的表現(xiàn),則是1.7倍。
二次元游戲《幻塔》這次在新技術(shù)的支持上終于還是走到了老對頭米哈游前面,新版將加入光追和DLSS 3。從測試來看,開啟DLSS 3后RTX 4080的幀率是不開的3.3倍,對比RTX 3080 Ti開DLSS 2則是1.6倍。這種游戲畫風(fēng)開DLSS對畫質(zhì)的影響其實很小,加入DLSS是個不錯的選擇。
《光明記憶:無限》開啟DLSS 3后,RTX 4080能跑到原生4K約2.5倍的幀率,約是RTX 3080 Ti開DLSS 2的1.5倍。
《微軟模擬飛行2020》在最新的UPDATE11更新后,性能表現(xiàn)變得更好。測試選用重慶到成都的航線,原生4K下RTX 4080能跑到74 fps,開啟DLSS 3性能模式后可以提升到172 fps,大概是原生的2.3倍。
延遲方面,由于RTX 40系自帶光流加速器,通過DLSS 3的光學(xué)多幀生成實現(xiàn)了更高的幀率,并通過Reflex有效降低了延遲,所以我們可以看到所有測試的游戲中,開啟DLSS 3的情況下PCL延遲都是遠(yuǎn)遠(yuǎn)低于4K原生設(shè)置的。因此,用RTX 40系顯卡玩支持DLSS 3的游戲,請一定記得在游戲中打開DLSS 3,不但畫面細(xì)節(jié)更豐富、游戲幀率更高,操控延遲也會變得更低,體驗也就更加迅捷絲滑了。
DLSS 3畫質(zhì)方面,從《賽博朋克2077》的截圖可以看到,即便是DLSS 3性能模式,畫面細(xì)節(jié)方面和原生也幾乎沒有什么差別,質(zhì)量模式更是完全看不出差別了。玩家完全可以放心開啟DLSS 3,同時享受精美的畫面與流暢的幀率。
此外,在RTX 40系列發(fā)布之后,眾多DLSS 3游戲也陸續(xù)到來。當(dāng)11月15日GeForce RTX 4080發(fā)售時,已有10款DLSS 3游戲發(fā)布,包括《瘟疫傳說:安魂曲》《光明記憶:無限》《毀滅全人類2:重新探測》《暗影火炬城》《F1 2022》《逆水寒》《生死輪回》《漫威蜘蛛俠:重制版》《微軟模擬飛行》和《超級人類》。此外《WRC Generations》《極品飛車:不羈》和《戰(zhàn)錘40K:暗潮》在RTX 4080推出后不久就會發(fā)布,圣誕節(jié)前玩家就可暢玩這些DLSS 3游戲。
SPEC包含了大量的工業(yè)軟件測試項目,在最新的2020V3.1版本中,RTX 4080相對于RTX 3080 Ti的提升還是比較明顯的。其中Energy能源測試集的提升最大,是RTX 3080 Ti的2.1倍。其實RTX 4080的表現(xiàn)甚至比RTX 3090 Ti還好。
常規(guī)的3D渲染軟件方面,Blender Benchmark 3.3中,RTX 4080對比RTX 3080 Ti提升也比較明顯,其中monster和classroom的性能是RTX 3080 Ti的1.6倍左右,而junkshop也有30%的提升。
RTX 4080在V-Ray中的表現(xiàn)也還可以,無論是使用RTX還是CUDA相對于RTX 3080 Ti都能實現(xiàn)50%的渲染效率提升。而OC渲染器中的性能提升則高達(dá)35%以上。
視頻剪輯方面,從PR2022來看,RTX 4080依舊要強(qiáng)過RTX 3080Ti,這還是在PR不支持雙編碼器的情況下。
至于達(dá)芬奇的話,做MagicMask魔法遮罩的效率提升也非常明顯,RTX 3080 Ti需要31秒完成的工作RTX 4080只要20秒就可以搞定。
至于新的AV1編碼,我們簡單看看達(dá)芬奇的輸出效率,RTX 4080和RTX 4090在輸出時間上的區(qū)別非常小,但是雙編碼器相對RTX 3080 Ti來說確實做到了成倍的效率提升。
此外,如果不考慮顯存容量的話,RTX 4080的單卡生產(chǎn)力性能甚至比RTX 3090 Ti還好一點。
總而言之,RTX 4080可以說是RTX 4090之下最強(qiáng)的消費級生產(chǎn)力GPU,3D渲染方面的綜合性能超越RTX 3080 Ti接近50%,視頻編碼性能更是成倍地提升,再考慮到CUDA與NVIDIA Studio生態(tài)圈在業(yè)界無可匹敵的地位,RTX 4080確實非常值得設(shè)計師用戶選擇。
DLSS3畫質(zhì)對比
溫度方面其實完全沒有什么可擔(dān)心的,畢竟RTX 4080 FE采用了和RTX 4090 FE一樣大的散熱器,既然這套散熱器搞定RTX 4090都沒問題,那應(yīng)付TGP 320W的RTX 4080就更沒問題了。
說到功耗,這里就不得不多說幾句了,從RTX 4090發(fā)布到現(xiàn)在RTX 4080上市,很多玩家可能看到這一代的旗艦和次旗艦的標(biāo)稱TGP功耗都不算低。對于TGP功耗而言,其實它是GPU運行在Boost狀態(tài)下的上限,用更容易理解的話來說,它其實是功耗墻上限。而作為功耗上限,并不是指GPU在日常使用和游戲中必須會達(dá)到的功耗。
由于采用了新的TSMC 4N NVIDIA定制工藝,使得RTX 40系列GPU有著更好的能耗比,在實現(xiàn)相同甚至更高的性能時,功耗更低。這就帶來一個現(xiàn)象,那就是在RTX 40系列GPU跑到TGP功耗上限前,頻率或電壓可能就已經(jīng)達(dá)到了上限,所以它無需更高的功耗才能滿足性能釋放需求。而在上一代Ampere架構(gòu)的GPU上,通常就需要跑到極限功耗才能完成最高性能釋放。從而造成了為什么RTX 40系列GPU總是跑不滿功耗的錯覺,實際上這是因為能耗比提升,無需更高功耗。
我們使用NVIDIA FramView工具監(jiān)測了一些RTX 4080 FE在一些游戲4K分辨率下的功耗表現(xiàn),可以看到在這些游戲中的平均功耗都沒有達(dá)到320W的TGP功耗。但是作為對比的上代對位的RTX 3080 Ti,幾乎都是頂著350W的上限在跑。
以《微軟模擬飛行2020》(原生4K最高畫質(zhì)下)為例,在該游戲中RTX 4080的幀速是RTX 3080 Ti的1.32倍左右,但功耗只有后者的73%。這樣可以計算出在該游戲中RTX 4080的能耗比達(dá)到了RTX 3080 Ti的1.7倍以上,可以說是表現(xiàn)非常出色了。
作為測試傳統(tǒng),我們同樣也跑了一下3DMark Speedway的循環(huán)考機(jī),并使用NVIDIA FramView工具監(jiān)測功耗,可以看到,在該測試中,RTX 4080 FE的功耗為308W,GPU最高溫度也只有60℃,節(jié)點溫度也就70℃,GPU最高頻率跑到了2820MHz。新的TSMC 4N NVIDIA 定制工藝帶來的能效比提升確實是相當(dāng)可觀的。
NVIDIA Ada Lovelace GPU架構(gòu)為RTX 40系列帶來了革命性的進(jìn)步,除了從TSMC 4N NVIDIA定制工藝獲得的超大芯片規(guī)模與高頻率增益之外,第三代RT Cores和第四代Tensor Cores也大顯神威,特別是全新加入的光流加速器,讓DLSS 3技術(shù)的光學(xué)多幀生成得以實現(xiàn),從而大幅增加了游戲幀率并降低了延遲。
RTX 4080作為RTX 40系列的次旗艦,從實測來看在DLSS的加持下也能讓主流游戲以4K極致光追設(shè)定高幀率流暢運行,在支持DLSS 3的游戲中幀率提升更是驚人,算得上是發(fā)燒級玩家的甜品級旗艦。
距離RTX 4090上市僅過去了一個月左右,就已經(jīng)有10款以上游戲加入并支持DLSS3,后期也將有更多游戲?qū)υ摷夹g(shù)提供支持,這和NVIDIA提供了方便的集成開發(fā)工具也是分不開的,這不僅僅是紙面上的新技術(shù),而是立馬能實裝的新技術(shù),這樣才能真正讓玩家獲得全新的體驗。
此外,從前面的生產(chǎn)力測試也可以看到,具備16GB大顯存的RTX 4080在3D渲染輸出與視頻剪輯方面相對RTX 3080 Ti也有巨大的性能增幅,特別是視頻編碼性能甚至做到了翻倍,對生產(chǎn)力應(yīng)用來講也可以稱得上是非常實用的高效工具。
在性能大幅提升的同時,RTX 4080的能耗比表現(xiàn)同樣也是比較不錯的。大部分游戲中的實際功耗都在300W以下,在提供高性能的同時,也能更好地緩解玩家的功耗焦慮。
因此,對于追求發(fā)燒級游戲體驗的玩家和追求高效率的設(shè)計師用戶來講,RTX 4080絕對算得上是當(dāng)前的“甜品旗艦”選擇。而GeForce RTX 4080 Founders Edition作為來自NVIDIA原廠的信仰級游戲神器,不但能提供4K光追游戲極致體驗和出色的生產(chǎn)力性能,還擁有極高的收藏價值,非常值得N飯第一時間入手!