RTX40系主力戰(zhàn)艦4K光追新霸主強(qiáng)勢登場

2022-12-02 06:22戴寅

電腦報 2022年45期

戴寅

采用NVIDIAAdaLovelace架構(gòu)的RTX4090顯卡已經(jīng)開始在市場中銷售，其空前強(qiáng)大的性能獲得了發(fā)燒級玩家的一致追捧。而在9月20日與RTX4090同時發(fā)布的RTX4080，也在約定的時間正式登場。作為RTX40系列目前的次旗艦，RTX4080也具備AdaLovelace架構(gòu)的一系列新特性與黑科技，如第三代RTCores與第四代TensorCores，當(dāng)然也包括可以讓游戲的視覺效果與幀率大幅提升的DLSS3，而價格方面則相對更甜品一些。因此，RTX4080也受到了游戲玩家與高性能用戶的廣泛關(guān)注，而11月15日RTX4080也正式迎來了性能解禁。本次測試我們使用的是來自NVIDIA的GeForceRTX4080FoundersEdition（以下簡稱RTX4080FE），想知道這款原廠信仰級神器到底實力如何？那就和我們一睹為快吧。

Ada Lovelace架構(gòu)全面升級，RTX 4080堪稱旗艦中的甜品

之前我們對NVIDIA Ada Lovelace架構(gòu)進(jìn)行過全面的解析，這里先簡單概括一下它的技術(shù)亮點。

●NVIDIA Ada Lovelace架構(gòu)中全新設(shè)計的流式多處理器具有最高 83 TFLOPS 的著色能力，吞吐量超過上代產(chǎn)品2倍。

●第三代 RT Cores 有效光線追蹤計算能力達(dá)到 191 TFLOPS，是上代產(chǎn)品的 2.8 倍。

●第四代 Tensor Cores 新增FP8引擎，具有高達(dá) 1.32 PFlops 的張量處理性能，超過上代 5 倍。

●支持著色器執(zhí)行重排序（SER），通過即時重新安排著色器負(fù)載來提高執(zhí)行效率。SER可為光線追蹤帶來最高3倍的性能提升，整體游戲性能可最高提升 25%。

●新增Ada光流加速器帶來2倍的性能提升，使DLSS 3能夠預(yù)測場景中幀和幀之間的運動變化，讓神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時提高幀率。

●架構(gòu)進(jìn)行大幅改進(jìn)，采用TSMC定制4N工藝，此工藝專為GPU優(yōu)化，實現(xiàn)高達(dá)2倍的能效飛躍。

●12GB顯存及以上型號提供雙NVIDIA編碼器（NVENC），可最多縮短一半的視頻導(dǎo)出時間，并提供了對AV1的硬件編碼支持。

Shader Executing Reordering（SER）著色器執(zhí)行重排序

著色器執(zhí)行重排序技術(shù)可以帶來更高的效率

GPU在完成大量并行計算的時候效率最高，而隨著游戲中光追效果越來越復(fù)雜，著色器面臨的可能就是大量發(fā)散的、無序的低效率工作任務(wù)，從而影響了渲染效率。SER技術(shù)的出現(xiàn)，就可以把這些雜亂的工作任務(wù)進(jìn)行分類，動態(tài)重組為更高效的任務(wù)，從而提升著色器的執(zhí)行效率。從NVIDIA官方數(shù)據(jù)來看，SER技術(shù)大約會帶來2倍的著色器性能提升。

第三代RT Cores

第三代RT Core 新增了“微映射透明度引擎”和“微網(wǎng)格置換引擎”

從RTX 20到RTX 30再到RTX 40，RT Cores進(jìn)化到了第三代。簡單地從有效光線追蹤計算能力來看，NVIDIA Ada Lovelace 架構(gòu)GPU的第三代RT Cores吞吐量達(dá)到了191 TFLOPS，是上一代的2.8倍之多。

另外，NVIDIA Turing和Ampere 架構(gòu)GPU中的RT Cores包括了用于加速邊界體積層次（BVH）數(shù)據(jù)結(jié)構(gòu)遍歷的加速單元，并執(zhí)行射線三角形和光線邊界框相交測試計算。Ampere的RT Cores中，BVH遍歷由Box Intersection Engine進(jìn)行加速，射線三角形相交測試由三角形相交引擎進(jìn)行加速，這已經(jīng)被證明是迄今為止處理光追工作負(fù)載最高效的引擎。而在Ada GPU的第三代RT Cores中，除了以上兩個功能外，還引入了“微映射透明度引擎”（OMM）和“微網(wǎng)格置換引擎”（DMM）。

微映射透明度引擎的作用是優(yōu)化光線追蹤渲染，大幅降低著色器的工作負(fù)載，這對于處理復(fù)雜物體光追特性來講提升是很大的。具體的原理是將光線追蹤特性烘焙到不透明的蒙版中，讓那些不規(guī)則的形狀與半透明的對象都能更快更精準(zhǔn)地被渲染出來。

微網(wǎng)格置換引擎則可以將面數(shù)非常多的復(fù)雜圖形做簡化，創(chuàng)造出更加簡單的模型，從而實現(xiàn)用基本三角形渲染復(fù)雜幾何圖形的目的，大大減少了計算量和對顯存的占用。從官方數(shù)據(jù)來看，微網(wǎng)格置換引擎可以讓光線追蹤的BVH速度最多提升15倍以上，而顯存占用最多可降低到原先的1/20，總之就是越復(fù)雜的模型，微網(wǎng)格置換引擎的優(yōu)化效果越突出。

第四代Tensor Cores

在Ada GPU上，Tensor Cores已經(jīng)進(jìn)化到了第四代，而這次Tensor Cores的升級尤其重磅。它配備了全新的FP8引擎，張量處理性能高達(dá)1.32 PetaFlops（相對上代提升了五倍之多）。第四代Tensor Cores最具革命性的進(jìn)步當(dāng)然是全新加入的光流加速器（Optical Flow Accelerator），而它就是NVIDIA DLSS 3黑科技的核心所在。

DLSS 3技術(shù)

DLSS3技術(shù)帶來了全新的光學(xué)多幀生成技術(shù)

DLSS技術(shù)作為RTX系列顯卡提升畫質(zhì)與幀率的專用黑科技，到RTX 40這一代進(jìn)化到了DLSS 3，跨度之大證明其改進(jìn)是革命性的，NVIDIA官方稱其代表了“神經(jīng)網(wǎng)絡(luò)渲染新時代”。

和之前的DLSS不同，DLSS 3在原有的超分辨率功能基礎(chǔ)上進(jìn)一步引入了光學(xué)多幀生成技術(shù)，簡單來說就是可以通過AI計算生成新的幀，而不像之前那樣只是生成像素。而這個幀生成的工作，是在Ada架構(gòu)中新的光流加速器完成的，當(dāng)然這就意味著DLSS 3中的“光學(xué)多幀生成”功能是RTX 40獨享的。

光流加速器可以在DLSS 2的基礎(chǔ)上計算兩幀之間的光流場，捕捉游戲畫面中從第1幀到第2幀之間變化的方向與速度，包含粒子、光線照射、反射等像素信息，通過計算運動矢量和光流場來精確重建畫面。

實時光學(xué)多幀生成技術(shù)可以直接生成幀而不是單獨的像素

總的來說，DLSS 2做的是通過AI計算出畫面上剩余的像素，而DLSS 3則在此基礎(chǔ)上還能計算出下一幀完整的畫面，這樣算下來DLSS 3等于是完全重建了實際顯示畫面7/8的像素，也可以說是重建了相當(dāng)于實際渲染像素7倍的像素。此外，由于DLSS 3的“幀生成”在GPU中后處理，所以即便是CPU性能出現(xiàn)瓶頸，也能提升游戲幀率。

按照官方數(shù)據(jù)，DLSS 3最多可帶來4倍的游戲性能提升。DLSS 3包含了“光學(xué)多幀生成”、“超分辨率”和“NVIDIA Reflex”三大部分，開發(fā)者只要整合DLSS 3，就可默認(rèn)支持DLSS 2。目前DLSS 3已經(jīng)得到了游戲開發(fā)者與游戲引擎的廣泛支持，在后面的詳細(xì)測試中我們會進(jìn)一步介紹DLSS 3游戲的情況。

NVIDIA Studio優(yōu)化

在生產(chǎn)力方面，NVIDIA GPU打造的CUDA生態(tài)圈已經(jīng)是業(yè)界無可匹敵的存在，RTX顯卡也是設(shè)計師們優(yōu)先考慮的高效工具，因此RTX 40系列配合NVIDIA Studio 驅(qū)動也將會為內(nèi)容創(chuàng)作者們提供更加出色的選擇?？偟膩碚f，目前RTX 可以加速 110 多款主流創(chuàng)意應(yīng)用，此外，SDK的提供使這些應(yīng)用更加高效，并提供獨家的功能，例如Optix、DLSS和Maxine。NVIDIA Studio 還提供了全套創(chuàng)意應(yīng)用，包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。

AV1與AI直播

AV1相比H.264等編碼方式可以在同碼率下提供更加清晰的視頻畫面，而且AV1還支持一些更先進(jìn)的編碼特性，例如HDR與低延遲。RTX 40的編碼器（顯存12GB以上的RTX 40系列，當(dāng)然包括RTX 4080，都提供了NVENC A V1雙編碼器）提供了對AV1硬件編碼的支持，而OBS和Discord等推流軟件都將在不久之后提供對NVENC AV1的支持，讓玩家享受到更加精美而流暢的直播視頻畫面。解碼方面，RTX 40的NVENC也繼承了RTX 30上的第5代硬件解碼器，支持MPEG-2、VC-1、H.264（AVCHD）、H.265（HEVC）、VP8/9以及AV1的硬件解碼。AI直播部分，NVIDIA在直播應(yīng)用技術(shù)上的更新有：面部表情預(yù)估、眼神追蹤（讓你看起來像是在看攝像頭），以及虛擬綠幕的質(zhì)量改進(jìn)，而開發(fā)者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的這些功能。

RTX 4080規(guī)格解析

那么RTX 4080作為RTX 40系列的次旗艦，規(guī)格如何呢？RTX 4080采用了AD103芯片，AD103相對AD102進(jìn)行了一些削減，GPC為7組，另外其中1個GPC還縮減了2組TPC只有4組。而RTX 4080在此基礎(chǔ)上進(jìn)一步減少了兩組TPC，總共擁有38組TPC。

因此，RTX 4080 GPU具有 9728個CUDA 核心，可提供 49 Shader-TFLOPS 傳統(tǒng)光柵渲染能力；304個第四代Tensor Cores 為AI處理和DLSS提供780 Tensor-TFLOPS的計算性能；76個第三代RT Cores具有113 RT-TFLOPS的計算性能，為下一代光線追蹤提供強(qiáng)勁動力；配備256 bit/16 GB美光GDDR6X顯存。根據(jù)官方數(shù)據(jù)來看，RTX 4080的性能最高可達(dá)RTX 3080 Ti的2倍，而功耗則降低了近10%。當(dāng)然，RTX 4080也具備Ada Lovelace架構(gòu)的多項技術(shù)，包括著色器執(zhí)行重排序（SER）、第三代 RT Cores 以及DLSS 3。

此外，細(xì)心的玩家也許注意到RTX 4080的RT Cores/Tensor Cores/TUs數(shù)量甚至要比RTX 3080 Ti少一些，顯存位寬也要低一些，那它是怎么做到性能反而更高的呢？前面已經(jīng)說過了，RTX 4080的SM單元經(jīng)過了進(jìn)一步優(yōu)化且支持SER技術(shù)，同時RT Cores與Tensor Cores都要高出一代，效率自然不可同日而語，此外GPU的二級緩存是RTX 3080 Ti的10.7倍，核心頻率更是高出50%以上，綜合這些因素，RTX 4080最終的性能其實是遠(yuǎn)遠(yuǎn)超過RTX 3080 Ti的。而在TGP方面，RTX 4080設(shè)定為320 W，比RTX 3080 Ti還低30 W，可見其先進(jìn)的制程確實帶來了極高的能效比。

完整的AD103 GPU核心圖

RTX 4080 GPU核心圖

“90旗艦”同款信仰級散熱方案，RTX 4080 FE實物賞析

NVIDIA的Founders Edition長期以來都是N飯心目中的信仰神器，在工業(yè)設(shè)計方面可以說是獨具特色，除了性能強(qiáng)悍之外也具備極高的收藏價值，而且在電氣性能方面也是眾多AIC廠商的參考標(biāo)桿。

RTX 4080 FE的外觀造型與RTX 4090 FE完全相同，銀色與黑色的搭配相得益彰，顯卡中央的X造型盡顯科技與信仰的力量。散熱器正面有一只軸流風(fēng)扇負(fù)責(zé)推風(fēng)，另一只軸流風(fēng)扇位于顯卡背面負(fù)責(zé)拉風(fēng)，從而在機(jī)箱中制造出更為高效的散熱風(fēng)道，提升整體的散熱效果。

RTX 4080 FE散熱器也搭載了新的散熱鰭片和氣流設(shè)計，相比上代旗艦的FE散熱器，RTX 4080 FE可產(chǎn)生的最大氣流高出20%，在同噪聲等級情況下，氣流可以高出15%，從而提供更高的散熱效率。

和RTX 4090 FE一樣，RTX 4080 FE的厚度已經(jīng)達(dá)到了3.5槽，重量接近2.2kg，散熱器的體積相當(dāng)?shù)目鋸?，旗艦的霸氣感十足。輔助電源接口當(dāng)然也是12Pin+4Pin，包裝盒也附送了一條12Pin+4Pin轉(zhuǎn)4×8Pin的轉(zhuǎn)接線。在RTX 4080 FE的側(cè)面，配備了GeForce RTX信仰燈，通電后會亮起白光，信仰感爆棚。顯卡尾部設(shè)計了一個磁吸蓋板，打開后會露出機(jī)架安裝孔位，方便在服務(wù)器機(jī)柜中安裝。

接口部分，RTX 4080 FE提供了3個DP 1.4接口和1個HDMI 2.1接口，可以支持8K/60Hz HDR10輸出。

RTX 4080 FE和上代FE一樣采用了異形PCB設(shè)計，整體布局和RTX 4090 FE在細(xì)節(jié)上有些不同，總供電相數(shù)為16，強(qiáng)大的供電設(shè)計可以提供更加平穩(wěn)的高負(fù)載輸出曲線，讓RTX 4080 GPU穩(wěn)定發(fā)揮全部性能。

實戰(zhàn)測試：RTX 4080飛躍式升級，性能倍增

測試平臺

顯卡：NVIDIA GeForce RTX 4080 Founders Edition

處理器：Intel酷睿i9 13900K

內(nèi)存：金士頓 DDR5 6000 16GB×2

主板：華碩ROG MAXIMUS Z790 HERO

硬盤：WD_BLACK SN850 2TB

電源：華碩ROG雷神Ⅱ 1200W

操作系統(tǒng)：Windows 11 專業(yè)版 22H2

測試中我們解鎖處理器功耗墻，并開啟BIOS中的Resize BAR選項。內(nèi)存選擇XMP DDR5 6000模式，分頻設(shè)定為自動。此外，還選用了RTX 3080 Ti與RTX 4090進(jìn)行對比。

基準(zhǔn)性能測試

首先是3DMark GPU基準(zhǔn)測試部分，不管是基于DX11的FireStrike系列還是基于DX12的TimeSpy系列，RTX 4080都相對RTX 3080 Ti領(lǐng)先了43%～46%。

3DMARK在近期更新了針對DX12 Ultimate的測試SpeedWay，能夠更好地展現(xiàn)次世代GPU在使用DX12U API的次世代游戲中的表現(xiàn)。在這個測試中，RTX 4080相對3080Ti的提升同樣達(dá)到了40%。

光追性能方面，PortRoyal測試中，RTX 4080比RTX 3080Ti提升了39%。在對GPU壓力較大的DXR純光追場景測試中，更是領(lǐng)先RTX 3080 Ti大約55%之多，Ada Lovelace的第三代RT Cores確實在效率方面更勝一籌。

DLSS部分，RTX 4080也保持了巨大的優(yōu)勢，在DLSS 2模式下，也領(lǐng)先RTX 3080 Ti大約45%。在DLSS 3項目中，RTX 3080 Ti不支持光學(xué)多幀生成，所以只相當(dāng)于運行DLSS 2的4K測試，而內(nèi)置光流加速器、完整支持DLSS 3的RTX 4080自然效率更高，領(lǐng)先RTX 3080 Ti大約128%！可謂飛躍式的升級了。同時，我們也可以看到，RTX 4080的基準(zhǔn)性能為RTX 4090的70%～77%，和它的芯片規(guī)模是比較符合的。

光柵化游戲性能測試

光柵化游戲部分，《古墓麗影：暗影》在2K分辨率下，RTX 4080比3080Ti多出了75 fps，提升幅度為44%，在4K分辨率下多出了37 fps，提升達(dá)到了39%。和RTX 4090相比，4K下的性能大約為它的67%。

《COD 19》中，RTX 4080無論在2K還是4K下相對3080Ti都有接近40%的幀率提升，在4K下則大約有RTX 4090的73%，相比《古墓麗影：暗影》表現(xiàn)要好一些。

《荒野大鏢客：救贖2》算是比較公平的游戲，RTX 4080相對RTX 3080 Ti無論在2K還是4K下的提升都超過了30%，4K下的提升略高一點達(dá)到了38%。它在4K下的幀率大約為RTX 4090的76%，差距不算太大。

育碧系游戲《刺客信條：英靈殿》，RTX 4080相對于RTX 3080 Ti同樣在2K和4K下都有30%出頭的優(yōu)勢，而在這里它只比RTX 4090低了15%左右。

《孤島驚魂6》對旗艦顯卡的優(yōu)化也不是很到位，2K下RTX 4080和RTX 4090只有5%的差距，有可能在處理器方面出現(xiàn)瓶頸問題了。而到了4K下，差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的幀率也高出了30%左右。

RTX 3080 Ti跑4K的《看門狗：軍團(tuán)》勉強(qiáng)能到60 fps多一點，而RTX 4080還是能接近90 fps，提升大約有38%。RTX 4080在4K下有RTX 4090大約75%的幀率。

優(yōu)化超好的3A大作《毀滅戰(zhàn)士：永恒》中，RTX 4080在4K下能超過240 fps，雖然RTX 3080 Ti幀率也不低，但是RTX 4080的提升已經(jīng)接近50%了，增幅非?？捎^。

同樣有這么大性能差距的游戲還有《殺手3》，RTX 4080在2K和4K下相對RTX 3080 Ti的幀率優(yōu)勢都超過了45%。

RTX 4080在《Control》中的表現(xiàn)相對平淡一些，相比RTX 3080 Ti在4K下大約有28%的幀率優(yōu)勢，相比RTX 4090則落后了29%。

賽車游戲《極限競速：地平線5》，4K下RTX 4080比RTX 3080 Ti多了35%的幀率，比RTX 4090低了18%。2K下的幀率和RTX 4090比較接近，顯然是處理器又出現(xiàn)了瓶頸。

再來看幾款電競網(wǎng)游。玩《絕地求生》的話RTX 4080也能達(dá)到最高畫質(zhì)4K/144Hz的標(biāo)準(zhǔn)，在4K下比RTX 3080 Ti高了33%，比RTX 4090低了31%，正好在中間位置。

暴雪的《守望先鋒2》里RTX 4080同樣也能達(dá)成最高畫質(zhì)4K/144Hz的標(biāo)準(zhǔn)，相比RTX 3080 Ti在4K下的幀率提升也有34%，而比RTX 4090則是低了29%。

《最終幻想14》的表現(xiàn)則符合之前的差距，RTX 4080相比RTX 3080 Ti提升30%左右，相比RTX 4090在4K下落后26%。

從這這些主流游戲的光柵化游戲性能測試結(jié)果來看，2K下RTX 4080相對于RTX 3080 Ti的提升在24%～50%之間，平均為36%。4K下提升在28%～46%之間，平均也是36%。相比RTX 4090，2K下的平均差距為15%，4K下大約有25%。

光追游戲性能測試

當(dāng)然，光追和DLSS才是RTX顯卡真正的精髓，我們當(dāng)然要用極限畫質(zhì)下的光追游戲來考驗RTX 4080的強(qiáng)悍性能。

同樣先來看看《古墓麗影：暗影》。之前在4K下不開光追，RTX 4080比RTX 3080 Ti的提升有39%，開啟光追后，提升進(jìn)一步加大到了43%，雖然光追核心不如RTX 3080 Ti多，但RTX 4080的光追單元畢竟高出一代，同時頻率也高很多，所以性能大幅提升也是情理之中。

《地鐵：離去增強(qiáng)版》4K下，RTX 3080 Ti不開DLSS已經(jīng)只有35 fps了，即使開啟DLSS質(zhì)量模式也達(dá)不到60 fps。RTX 4080在4K下的優(yōu)勢達(dá)到了49%，開啟DLSS還可以跑到80 fps。

《看門狗：軍團(tuán)》的硬件要求也比較高，也是同樣的情況，RTX 3080 Ti在開啟DLSS的情況下才能勉強(qiáng)達(dá)到4K/60 fps，RTX 4080在4K下有接近40%的優(yōu)勢，開啟DLSS更是可以跑到79 fps。

《Control》中的表現(xiàn)也沒有什么意外，不過在這里RTX 4080相對于RTX 3080 Ti的優(yōu)勢稍微小一些，4K下提升為26%，開啟DLSS后提升為31%。

《孤島驚魂6》再次展現(xiàn)了它對旗艦顯卡的優(yōu)化不足，游戲中2K分辨率下RTX 4080和RTX 4090的幀率居然是一樣的。不過4K下的表現(xiàn)就比較正常了，RTX 4080比RTX 3080 Ti高了27%。

硬件殺手游戲《我的世界》RTX版里，DLSS默認(rèn)就是和光追綁定的，開光追默認(rèn)就開DLSS，如果手動關(guān)掉的話，RTX 3080 Ti就只有36 fps了，不過RTX 4080還是能接近60 fps，提升達(dá)到了50%，如果開啟DLSS的話，優(yōu)勢可以達(dá)到55%。

賽車游戲《F1 22》中，RTX 4080相對于RTX 3080 Ti的提升同樣在30%以上，自己則落后RTX 4090大約25%。

此外，我們還測試了《光明記憶：無限》《毀滅戰(zhàn)士：永恒》《生化危機(jī)8》，在這3款游戲中，開啟光追后RTX 4080相對于RTX 3080 Ti在4K下的提升也都在40%以上。

總體來看，綜合這些游戲的表現(xiàn)，在開啟光追后，RTX 4080相對于RTX 3080 Ti的提升大約為40%，達(dá)到了RTX 4090大約72%的性能。開啟DLSS后，RTX 4080相對于RTX 3080 Ti的提升為41%，和RTX 4090的差距大約為26%。

DLSS 3測試

我們知道，DLSS 3是RTX 40系列的重頭戲，它由DLSS 2超分辨率+幀生成+REFLEX三大部分組成。從RTX 4090發(fā)布到現(xiàn)在支持DLSS 3的游戲也越來越多了，這次我們選取了其中幾款進(jìn)行了測試（使用NVIDIA FramView工具監(jiān)測幀率與PCL延遲）。

《賽博朋克2077》在4K超級光追預(yù)設(shè)下，RTX 4080開啟DLSS 3性能模式后，幀速從30 fps暴增至114 fps，如果和RTX 3080 Ti開DLSS 2性能模式相比，則提升了近一倍。

《生死輪回》中RTX 4080開啟DLSS 3后可以提升近100 fps，RTX 3080 Ti開DLSS 2的話只有92 fps，RTX 4080的DLSS 3優(yōu)勢還是比較明顯。

《瘟疫傳說：安魂曲》原生4K最高畫質(zhì)下RTX 4080能跑到接近60 fps，開DLSS 3后暴增至160 fps，接近原生的2.8倍。對比RTX 3080 Ti開DLSS 2的表現(xiàn)，則是1.7倍。

二次元游戲《幻塔》這次在新技術(shù)的支持上終于還是走到了老對頭米哈游前面，新版將加入光追和DLSS 3。從測試來看，開啟DLSS 3后RTX 4080的幀率是不開的3.3倍，對比RTX 3080 Ti開DLSS 2則是1.6倍。這種游戲畫風(fēng)開DLSS對畫質(zhì)的影響其實很小，加入DLSS是個不錯的選擇。

《光明記憶：無限》開啟DLSS 3后，RTX 4080能跑到原生4K約2.5倍的幀率，約是RTX 3080 Ti開DLSS 2的1.5倍。

《微軟模擬飛行2020》在最新的UPDATE11更新后，性能表現(xiàn)變得更好。測試選用重慶到成都的航線，原生4K下RTX 4080能跑到74 fps，開啟DLSS 3性能模式后可以提升到172 fps，大概是原生的2.3倍。

延遲方面，由于RTX 40系自帶光流加速器，通過DLSS 3的光學(xué)多幀生成實現(xiàn)了更高的幀率，并通過Reflex有效降低了延遲，所以我們可以看到所有測試的游戲中，開啟DLSS 3的情況下PCL延遲都是遠(yuǎn)遠(yuǎn)低于4K原生設(shè)置的。因此，用RTX 40系顯卡玩支持DLSS 3的游戲，請一定記得在游戲中打開DLSS 3，不但畫面細(xì)節(jié)更豐富、游戲幀率更高，操控延遲也會變得更低，體驗也就更加迅捷絲滑了。

DLSS 3畫質(zhì)方面，從《賽博朋克2077》的截圖可以看到，即便是DLSS 3性能模式，畫面細(xì)節(jié)方面和原生也幾乎沒有什么差別，質(zhì)量模式更是完全看不出差別了。玩家完全可以放心開啟DLSS 3，同時享受精美的畫面與流暢的幀率。

此外，在RTX 40系列發(fā)布之后，眾多DLSS 3游戲也陸續(xù)到來。當(dāng)11月15日GeForce RTX 4080發(fā)售時，已有10款DLSS 3游戲發(fā)布，包括《瘟疫傳說：安魂曲》《光明記憶：無限》《毀滅全人類2：重新探測》《暗影火炬城》《F1 2022》《逆水寒》《生死輪回》《漫威蜘蛛俠：重制版》《微軟模擬飛行》和《超級人類》。此外《WRC Generations》《極品飛車：不羈》和《戰(zhàn)錘40K：暗潮》在RTX 4080推出后不久就會發(fā)布，圣誕節(jié)前玩家就可暢玩這些DLSS 3游戲。

生產(chǎn)力測試

SPEC包含了大量的工業(yè)軟件測試項目，在最新的2020V3.1版本中，RTX 4080相對于RTX 3080 Ti的提升還是比較明顯的。其中Energy能源測試集的提升最大，是RTX 3080 Ti的2.1倍。其實RTX 4080的表現(xiàn)甚至比RTX 3090 Ti還好。

常規(guī)的3D渲染軟件方面，Blender Benchmark 3.3中，RTX 4080對比RTX 3080 Ti提升也比較明顯，其中monster和classroom的性能是RTX 3080 Ti的1.6倍左右，而junkshop也有30%的提升。

RTX 4080在V-Ray中的表現(xiàn)也還可以，無論是使用RTX還是CUDA相對于RTX 3080 Ti都能實現(xiàn)50%的渲染效率提升。而OC渲染器中的性能提升則高達(dá)35%以上。

視頻剪輯方面，從PR2022來看，RTX 4080依舊要強(qiáng)過RTX 3080Ti，這還是在PR不支持雙編碼器的情況下。

至于達(dá)芬奇的話，做MagicMask魔法遮罩的效率提升也非常明顯，RTX 3080 Ti需要31秒完成的工作RTX 4080只要20秒就可以搞定。

至于新的AV1編碼，我們簡單看看達(dá)芬奇的輸出效率，RTX 4080和RTX 4090在輸出時間上的區(qū)別非常小，但是雙編碼器相對RTX 3080 Ti來說確實做到了成倍的效率提升。

此外，如果不考慮顯存容量的話，RTX 4080的單卡生產(chǎn)力性能甚至比RTX 3090 Ti還好一點。

總而言之，RTX 4080可以說是RTX 4090之下最強(qiáng)的消費級生產(chǎn)力GPU，3D渲染方面的綜合性能超越RTX 3080 Ti接近50%，視頻編碼性能更是成倍地提升，再考慮到CUDA與NVIDIA Studio生態(tài)圈在業(yè)界無可匹敵的地位，RTX 4080確實非常值得設(shè)計師用戶選擇。

DLSS3畫質(zhì)對比

功率與溫度測試

溫度方面其實完全沒有什么可擔(dān)心的，畢竟RTX 4080 FE采用了和RTX 4090 FE一樣大的散熱器，既然這套散熱器搞定RTX 4090都沒問題，那應(yīng)付TGP 320W的RTX 4080就更沒問題了。

說到功耗，這里就不得不多說幾句了，從RTX 4090發(fā)布到現(xiàn)在RTX 4080上市，很多玩家可能看到這一代的旗艦和次旗艦的標(biāo)稱TGP功耗都不算低。對于TGP功耗而言，其實它是GPU運行在Boost狀態(tài)下的上限，用更容易理解的話來說，它其實是功耗墻上限。而作為功耗上限，并不是指GPU在日常使用和游戲中必須會達(dá)到的功耗。

由于采用了新的TSMC 4N NVIDIA定制工藝，使得RTX 40系列GPU有著更好的能耗比，在實現(xiàn)相同甚至更高的性能時，功耗更低。這就帶來一個現(xiàn)象，那就是在RTX 40系列GPU跑到TGP功耗上限前，頻率或電壓可能就已經(jīng)達(dá)到了上限，所以它無需更高的功耗才能滿足性能釋放需求。而在上一代Ampere架構(gòu)的GPU上，通常就需要跑到極限功耗才能完成最高性能釋放。從而造成了為什么RTX 40系列GPU總是跑不滿功耗的錯覺，實際上這是因為能耗比提升，無需更高功耗。

我們使用NVIDIA FramView工具監(jiān)測了一些RTX 4080 FE在一些游戲4K分辨率下的功耗表現(xiàn)，可以看到在這些游戲中的平均功耗都沒有達(dá)到320W的TGP功耗。但是作為對比的上代對位的RTX 3080 Ti，幾乎都是頂著350W的上限在跑。

以《微軟模擬飛行2020》（原生4K最高畫質(zhì)下）為例，在該游戲中RTX 4080的幀速是RTX 3080 Ti的1.32倍左右，但功耗只有后者的73%。這樣可以計算出在該游戲中RTX 4080的能耗比達(dá)到了RTX 3080 Ti的1.7倍以上，可以說是表現(xiàn)非常出色了。

作為測試傳統(tǒng)，我們同樣也跑了一下3DMark Speedway的循環(huán)考機(jī)，并使用NVIDIA FramView工具監(jiān)測功耗，可以看到，在該測試中，RTX 4080 FE的功耗為308W，GPU最高溫度也只有60℃，節(jié)點溫度也就70℃，GPU最高頻率跑到了2820MHz。新的TSMC 4N NVIDIA 定制工藝帶來的能效比提升確實是相當(dāng)可觀的。

總結(jié)：旗艦中的甜品，Ada Lovelace“80”新戰(zhàn)力定義4K光追極致體驗

NVIDIA Ada Lovelace GPU架構(gòu)為RTX 40系列帶來了革命性的進(jìn)步，除了從TSMC 4N NVIDIA定制工藝獲得的超大芯片規(guī)模與高頻率增益之外，第三代RT Cores和第四代Tensor Cores也大顯神威，特別是全新加入的光流加速器，讓DLSS 3技術(shù)的光學(xué)多幀生成得以實現(xiàn)，從而大幅增加了游戲幀率并降低了延遲。

RTX 4080作為RTX 40系列的次旗艦，從實測來看在DLSS的加持下也能讓主流游戲以4K極致光追設(shè)定高幀率流暢運行，在支持DLSS 3的游戲中幀率提升更是驚人，算得上是發(fā)燒級玩家的甜品級旗艦。

距離RTX 4090上市僅過去了一個月左右，就已經(jīng)有10款以上游戲加入并支持DLSS3，后期也將有更多游戲?qū)υ摷夹g(shù)提供支持，這和NVIDIA提供了方便的集成開發(fā)工具也是分不開的，這不僅僅是紙面上的新技術(shù)，而是立馬能實裝的新技術(shù)，這樣才能真正讓玩家獲得全新的體驗。

此外，從前面的生產(chǎn)力測試也可以看到，具備16GB大顯存的RTX 4080在3D渲染輸出與視頻剪輯方面相對RTX 3080 Ti也有巨大的性能增幅，特別是視頻編碼性能甚至做到了翻倍，對生產(chǎn)力應(yīng)用來講也可以稱得上是非常實用的高效工具。

在性能大幅提升的同時，RTX 4080的能耗比表現(xiàn)同樣也是比較不錯的。大部分游戲中的實際功耗都在300W以下，在提供高性能的同時，也能更好地緩解玩家的功耗焦慮。

因此，對于追求發(fā)燒級游戲體驗的玩家和追求高效率的設(shè)計師用戶來講，RTX 4080絕對算得上是當(dāng)前的“甜品旗艦”選擇。而GeForce RTX 4080 Founders Edition作為來自NVIDIA原廠的信仰級游戲神器，不但能提供4K光追游戲極致體驗和出色的生產(chǎn)力性能，還擁有極高的收藏價值，非常值得N飯第一時間入手！

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡