一、前言: RTX 40的功耗 你真的了解吗?
RTX 4090的性能、能效表现都可以说是无可挑剔的:
4K分辨率下平均领先上代卡皇RTX 3090 Ti 50%以上,革命性的DLSS 3可以带来数倍的性能提升,超高能效使得实际游戏功耗只有200-380W,温度也不超过60℃……
当然,12999元起虽然也很有“性价比”,但它毕竟是旗舰级别的发烧友专享。
现在,面向更广泛高端游戏玩家的RTX 4080终于来了!
这一次,我们快科技会对RTX 4080的光栅游戏性能、光追游戏性能、DLSS 3游戏性能、功耗散热等进行考察,让大家对它有一个全方位的了解。
1、RTX 4080核心规格
RTX 4080依然基于定制的台积电4N制造工艺、全新的Ada Lovelace GPU架构,核心编号AD103,但和RTX 4090、AD102一样,它也不是满血的,为以后的RTX 4080 Ti留下了悬念。
AD103核心集成了多达459亿个晶体管,面积为378.6平方毫米,集成度超过1.2亿个晶体管每平方毫米。
AD103核心内部组成可以分为7组GPC、80组TPC、160组SM,每一组SM 128个CUDA核心,整个核心总计1024个CUDA核心。
可以看到,AD103本身就采用了非对称设计,其中6组GPC都是各有12组SM,最后一组GPC只有8组GPC。
如此布局只是为了达成特定的规格,对于性能释放并无影响。
RTX 4080屏蔽了其中2组GPC里的各2组SM,总共开启76组SM、9728个CUDA核心。
另外,它还有304个第四代Tensor张量核心、76个第三代RT光追核心、304个纹理单元、112个ROP单元。
二级缓存保留完整的64MB,相比RTX 3080 Ti 6MB增加了10多倍,而大容量的二级缓存可以有效提升内部传输带宽,直接提升游戏性能。
显存给到256-bit,并不是很慷慨,不过好在GDDR6X的显存频率足够高,等效于22.4GHz,因此达成了716.8GB/s的带宽,不会是瓶颈。
另外值得一提的是,AD103原本设计了6组NVENC视频编解码器,但是在RTX 4080上只开了一半3组,阉割得有些厉害,对于视频编解码性能,尤其是面对最新的AV1,会有一定的影响。
如果你想拿来做视频生产力,一定得掂量掂量。
2、RTX 4080功耗漫谈
关于显卡功耗,历来都是关注和争议的焦点,尤其是如今高端显卡的功耗与日俱增,更让众多玩家坐卧不安。
但事实上,功耗这个问题非常复杂,规格的标注、应用的场景复杂多元化,很难一言以蔽之,也造成不少误会。
RTX 4090的功耗标称450W,再加上使用了峰值供电能力600W的全新12VHPWR 16针供电接口,这吓坏了不少人。
RTX 4090评测的时候,我们快科技在众多媒体中唯一对三种分辨率下的实际游戏功耗进行了详细测试,结果发现,RTX 4090远没有那么电老虎:
经过多款游戏测试,RTX 4090在1080P分辨率下,大多数3A游戏中的实际运行功耗只有200~250W左右,2K分辨率下的功耗也只有310W左右,很难超过330W。
即便是在压力很大的4K分辨率下,RTX 4090的运行功耗也在380W之下,从未超过400W。
只有在FurMark极限烤机的时候,RTX 4090的功耗才达到约440W,但这个数字并没有任何实际意义,谁也不会一直百分百负载烤机对不对?
事实上,RTX 40系列标注的功耗,叫做“TGP”(Total Graphics Power),严格而言指的是“功耗墙”,是GPU Boost加速频率运行功耗的一个上限,是与散热限制结合来约束运行频率的。
当GPU运行中度或轻度负载的时候,或者收到CPU性能瓶颈限制的时候,GPU Boost频率依然可以达到最高值,这个时候GPU的效率也是最大化的。
RTX 4080也是同样的道理,标称TDP 320W,实际上远远达不到,NVIDIA官方给出的平均游戏功耗仅仅250W左右,还留有足足30%的空间。
本次测试中,我们也会实际考察RTX 4080的游戏功耗到底几何。
3、DLSS 3游戏进展
DLSS 3是Ada Lovelace架构的点睛之笔,其核心是革命性的帧生成技术,简单说就是软硬件结合,智能地在两个游戏帧画面之间生成插入一帧,再加上超分辨率缩放技术,整个游戏画面7/8都是非渲染出来的,性能提升自然是数倍的。
自诞生以来,DLSS 3很快得到了超过35款游戏和应用的支持,正在快速陆续落地,截至今天可玩的已有10款:
《瘟疫传说:安魂曲》(A Plague Tale: Requiem)
《光明记忆:无限》(Bright Memory: Infinite)
《毁灭全人类2:重新探测》(Destroy All Humans! 2 - Reprobed)
《暗影火炬城》(F.I.S.T.: Forged in Shadow Torch)
《F1 22》
《逆水寒》(Justice)
《生死轮回》(Loopmancer)
《漫威蜘蛛侠:重制版》(Marvel's Spider-Man Remastered)
《微软模拟飞行》(Microsoft Flight Simulator )
《超级人类》(SUPER PEOPLE)
另外,明天的《WRC Generations》、29日的《极品飞车:不羁》、30日的《《战锤40K:暗潮》,也都会支持DLSS 3,也就是本月内会达到13款。
二、图赏:和RTX 4090长一样 简直就是牛刀杀鸡
送来一条3x8Pin转16Pin的电源线。RTX 4090上是4×8Pin。
显卡正面,造型和RTX 4090一模一样。
背面。
顶部视角图,RTX 4090同样的3.5槽厚度,还有一个16Pin供电接口。
底部视角图。
3个DP1.4和1个HDMI 2.1接口。
和RTX 4090几乎相同的散热器,大面积的均热板+6条8mm复合热管,镇压RTX 4080这样的显卡,给人牛刀杀鸡的感觉。
非常迷你的PCB板,13+3相供电电路设计,另外还有大量的空焊位,为了将来的RTX 4080 Ti保留了充足的空间。
背面设计与RTX 4090有比较大的区别,后者供电电容几乎都放在了背面。
RTX 4080由于PCB板正面空间较多,很多电容就放在了正面,背面的电容不多。
RTX 4080采用的是AD103-300-A1核心,芯片面积378mm2,拥有459亿晶体管。
GPU旁边是8颗美光GDDR6X显存,单颗2GB,总容量16GB,等效频率22.4GHz,带宽716GB/s。
三、测试平台简介:对比A卡为蓝宝石RX 6950 XT LE毒药水冷版
测试平台如下:
这里有2点需要特别指出,其一就是我们缺少RX 6950 XT公版,于是采用了蓝宝石 RX 6950 XT LE毒药水冷版替代测试,这块显卡的性能比公版要强7%左右。
第二点就是为了尽量减少系统性能瓶颈,我们将芝奇Trident Z5 Neo焰锋戟DDR5-6000 16GBx2超频到了6400MHz,时序依旧维持30-38-38-96不变。
下面是本次使用的测试平台简介!
处理器当然是i9-13900K。
ROG MAXIMUS Z790 HERO主板,5000元级Z790主板不二之选。
芝奇Trident Z5 Neo焰锋戟DDR5-6000 16GBx2套条,它的时序仅有30-38-38-96,频率6000MHz,电压1.35V。
我们测试时超频到了6400MHz,同时维持原有时序不变。
我们使用的是技嘉UD1000GM PG5 1000W金牌电源,这款电源12V的电流高达83.3A,也就是12V的输出功率就达到了1000W的额定功率。
这款电源支持ATX 12V 3.0标准,提供了一个12VHPWR接口,单个接口就能提供660W功率,可以原生支持AMD、NVIDIA下一代的PCIe 5.0显卡,不需要额外的4x8PIN to 16Pin转接线。
鑫谷昆仑KL-360 ARGB水冷散热器采用了独家的分离式水泵,并且在冷头部分嵌入了一个70mm PWM风扇,可以直接吹到主板的供电电路,相比传统水冷散热器能将VRM温度降低12度。
希捷酷玩2TB SSD,目前最强的PCIe 4.0 SSD之一,顺序读写速度都能达到7000MB/s,AS SSD跑分轻松过12000。
用了多年的华硕玩家国度PG27UQ ROG 27英寸IPS电竞显示器。
4K UHD(3840*2160)分辨率、4ms响应时间、144Hz刷新率、G-Sync 技术、IPS+量子点面板、10bit色彩、Display HDR1000认证,直到现在依旧是市面上顶级的电竞显示器。
四、理论性能测试:3DMark运行频率可达2790MHz
1、3DMark
在2K分辨率3DMark Fire Extreme测试中,RTX 4080图形分数达到了33564分,核心温度最高54℃,核心运行最高频率为2790MHz,最高功耗.305W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4080图形分数达到了17112分,核心温度最高57℃,核心运行最高频率为2790MHz,最高功耗311W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 4080图形分数达到了27989分,核心温度最高63℃,核心运行最高频率为2760MHz,最高功耗413W。
在4K分辨率3DMark Time Spy Extreme测试中, RTX 4080图形分数达到了13851分,核心温度最高65℃,核心运行最高频率为2760MHz,最高功耗440W。
五、1080P与2K游戏测试:比RTX 3090 Ti强19%
1、刺客信条:英灵殿
2、德军总部:新血脉
3、地平线:零之曙光
4、帝国时代4
5、孤岛惊魂5
6、孤岛惊魂6
7、古墓丽影:暗影
8、极限竞速:地平线5
9、赛博朋克2077
10、巫师3
11、无主之地3
12、战争机器5
测试数据汇总如下:
在使用i9-13900K平台上,1080P分辨率下处理器依然存在巨大的瓶颈,但情况比i9-12900K要好很多。
综合12款游戏,RTX 4080平均领先RTX 3080 Ti约20%,比RTX 3080快了33%,比RTX 3090 Ti也快了13%的样子。
2K分辨率好了很多,RTX 4080比RTX 3080快了将近50%,比起RTX 3080 Ti也有30%的领先优势。
六、4K游戏测试:比RTX 3080强了近50%
1、刺客信条:英灵殿
2、德军总部:新血脉
3、地平线:零之曙光
4、帝国时代4
5、孤岛惊魂5
6、孤岛惊魂6
7、古墓丽影:暗影
8、极限竞速:地平线5
9、赛博朋克2077
10、巫师3
11、无主之地3
12、战争机器5
测试数据汇总如下:
4K分辨率下,RTX 4080受制于256Bit位宽,提升幅度相比2K分辨率略有不及,与RTX 4090的差距从2K分辨率时的19%扩大到了36%,相比RTX 3090 Ti的领先优势也从2K分辨率的19%缩减到了15%。
不过和RTX 3080相比,依旧有接近50%的领先优势,比RTX 3080 Ti则快 了29%。
十、总结:有史以来性能最强的256Bit位宽显卡。
2年前我们测试RTX 30系列时,高端的RTX 3080、3080 Ti、3090几乎拉不开差距。
2年后的今天,我们将处理器从i9-10900K换成了i9-13900K,内存从DDR4 4000换成了DDR5 6400MHz CL30,这时才真正看清了这些显卡之间的性能差异,比如RTX 3090 Ti比RTX 3080足足强了30%。
好了,闲话少说,以下似乎本次测试小结!
1、功耗
如今的TGP再也不能代表显卡的功耗,它只是一个功耗墙而已,千万不要以为RTX 4080和RTX 3080的TGP都是320W,他们的功耗就一样了。
我们做了6款游戏的功耗对比测试,RTX 3080在1080P分辨率下就可以撞上320W的TGP功耗墙,而RTX 4080在大部分3A游戏中,1080P分辨率下的功耗在230W左右,《GTA V》甚至只有125W,仅相当于RTX 3080一半。
相比TGP,PPW(每瓦特性能)能更加直观的反映显卡的实际效能,就我们测试的数据而言,RTX 4080的每瓦特性能相比RTX 3080提升了60~70%。
2、性能
不得不说老黄的刀法真的精准!当初RTX 3080相比上代RTX 2080 T性能提升了30%,这一代的RTX 4080和RTX 3080 Ti相比,又刚好提升了30%。
另外和上代的RTX 3080比起来,RTX 4080在2K和4K分辨率都有将近50%的提升,不知道这样的性能表现是否能让你满意。
3、DLSS 3和光追
目前可玩的DLSS 3游戏已有10余款,此次我们测试了8款。在开启DLSS 2之后,游戏帧率提升幅度为116%,打开DLSS 3,游戏帧率提升幅度达到了163%,特别是《赛博朋克2077》,提升了超过300%。
不过,也有多款游的DLSS 3功能还支持不太完善,比如《光明记忆:无限》、《暗影火炬城》、《超级突破》,这3款游戏开启DLSS 3之后帧率几乎没太大变化。
另外,RTX 4080拥有76个第三代RT Core,开启光追之后,游戏帧率平均下跌53%,而RTX 3080 Ti下降幅度达到了62%,新一代的光追单元运算效率比前辈要高了不少。
4、散热表现
就公版而言,拿RTX 4090的散热套在RTX 4080上真的有点大材小用,实测烤机半小时,GPU温度只有63度,比起RTX 4090低了10度以上。
而在正常游戏中,RTX 4080的实际功耗远没有达到320W的TGP功耗墙,运行3A游戏时基本上都在50度上下,这和RTX 3080动辄80度简直就不可同日而语。
可以说,除了价格,RTX 4080在各方面的表现都达到甚至超出了我们的预期。原以它只是一块256Bit位宽的显卡,原以为会受到诸多掣肘,现在看来并非如此,RTX 4080是有史以来性能最强的256Bit位宽显卡。
不知道即将上市的192Bit RTX 4070 Ti会有怎样的表现!
RTX 4080远远超越了上代旗舰,更多的天梯榜信息请参考https://rank.kkj.cn/dgpu3.shtml
七、DLSS 3游戏测试之一:四款DLSS 3游戏
此次我们一共测试了8款游戏,包括4款支持DLSS 3的游戏:《3DMark》、《超级突破》、《毁灭全人类》、《模拟飞行2020》。
另外还有4款同时支持DLSS与光追的游戏:《暗影火炬城》、《光明记忆》:《无限、生死轮回》、《赛博朋克2077》。
1、3DMark
DLSS 2模式下帧率为101FPS,比默认的39FPS提升了158%。
DLSS 3的成绩为131FPS,比起默认的39FPS提升了238%。
2、超级突破
这是默认画质。
这是DLSS 3的画质,DLSS开启性能模式后,对于图像质量多少还是有那么一点影响,不过不仔细看,也能以察觉。
3、毁灭全人类2
最高画质下,RTX 4080的帧率为95FPS。
开启DLSS 3之后,帧率来到了181FPS。
将画面放大数倍,也难以差距DLSS 3与原生画面的差异。
4、微软模拟飞行2020
默认最高画质,帧率63FPS。
DLSS 3的帧率达到了162FPS。
八、DLSS 3游戏测试之一:四款支持光追的DLSS 3游戏
这里测试的是四款同时支持DLSS和光追的游戏。
1、暗影火炬城
开启光追之后,游戏的帧率只有86FPS。
这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了188FPS。
2、光明记忆:无限
开启RTX时,游戏的帧率只有75FPS。
开启DLSS 3之后,帧率提升到了222FPS。
3、生死轮回
开启光追之后,游戏的帧率仅有49FPS。
打开DLSS 3之后,帧率暴增到了146FPS。
4、赛博朋克2077
打开光追后,帧率只有28FPS,几乎无法正常运行。
开启DLSS 3之后,帧率直接来到了113FPS。
八款DLSS 3游戏测试数据汇总如下:
RTX 3080 Ti在开启光追后,4款游戏帧率平均下跌62%,而RTX 4080则下跌了53%,说明新一代显卡的光追效率的确有提升。
在DLSS方面,八款游戏开启DLSS技术之后,帧率平均提升116%,而打开DLSS 3之后,帧率提升了163%。
特别是《赛博朋克2077》,开启DLSS 3之后帧率提升幅度高达304%。
九、实际游戏功耗测试:烤机半小时仅63度 每瓦性能提升60%
1)、烤机测试
使用Furmark来对RTX 4080进行烤机测试,测试是室温为28度。
将Furmark的参数设定为1920*1200分辨率、0AA。
运行14分钟之后,RTX 4080的温度稳定在62度附近,这个温度比RTX 4090低了10度左右,显卡的功耗稳定在323W,烤机时GPU频率为2085MHz,CPU风扇转速只有1361RPM,基本上听不到风扇的噪音。
2)、真实游戏功耗测试
此前大家一直对显卡的TGP有误解,以为就是GPU的功耗,但事实并非如此。下面我们运行6款游戏,对比RTX 4080与RTX 3080的功耗差异,它们的TGP都是320W。
1、GTA V
1080P分辨率下,RTX 4080的GPU占用率为40%、功耗123W,帧率187FPS,温度41度。
而RTX 3080的GPU占用率达到了58%,功耗高达241W,帧率同样187FPS,温度68度。
可以看到,1080P分辨率下,RTX 4080的功耗只有RTX 3080的一半。
这是2K分辨率的数据。
RTX 4080功耗为159W,GPU占用率51%,帧率188FPS,温度47度
RTX 3080功耗为295W,GPU占用率74%,帧率187FPS,温度73度。
4K分辨率数据如下:
RTX 4080功耗为274W,GPU占用率94%,帧率187FPS,温度51度
RTX 3080功耗为320W,GPU占用率99%,帧率143FPS,温度77度。
2、绝地求生
这是1080P分辨率的截图。
RTX 4080功耗为268W,GPU占用率98%,帧率520FPS,温度59度
RTX 3080功耗为310W,GPU占用率100%,帧率342FPS,温度82度。
2K分辨率数据如下:
RTX 4080功耗为294W,GPU占用率99%,帧率378FPS,温度60度
RTX 3080功耗为320W,GPU占用率99%,帧率241FPS,温度83度。
这是4K分辨率下的截图。
RTX 4080功耗为304W,GPU占用率100%,帧率202FPS,温度60度
RTX 3080功耗为308W,GPU占用率100%,帧率241FPS,温度83度。
之所以RTX 3080功耗降到了308W,是因为GPU温度太高撞上了温度墙。
3、赛博朋克2077
1080P分辨率数据如下:
RTX 4080功耗为153W,GPU占用率89%,帧率179FPS,温度51度
RTX 3080功耗为317W,GPU占用率99%,帧率132FPS,温度74度。
上面是2K分辨率截图
RTX 4080功耗为269W,GPU占用率98%,帧率126FPS,温度56度
RTX 3080功耗为320W,GPU占用率99%,帧率 93FPS,温度74度。
这是4K分辨率的截图。
RTX 4080功耗为298W,GPU占用率99%,帧率65FPS,温度57度
RTX 3080功耗为321W,GPU占用率96%,帧率46FPS,温度79度。
我们一共对比测试了6款游戏,就不在这里一一展示了,下面以图表的形势更直观的展现出来。
1080P分辨率下,RTX 4080在《绝地求生》中的功耗最高,为268W,但是它的帧率也达到了恐怖的520FPS,相比之下RTX 3080的功耗高达310W,帧率却只有342FPS。
另外,在《GTA V》中,受制于系统性能,游戏帧率都没有限制在187FPS,此时RTX 4080的功耗为125W,约为RTX 3080的一半。
可以说是相同性能下,能效比提升1倍。
2K分辨率下,RTX 3080几乎所有的游戏都跑满了TGP(320W),仅有《GTA V》例外,功耗为295W。
而RTX 4080功耗最高的游戏是《绝地求生》,达到了294W,比RTX 3080低26W,不过帧率比起RTX 3080要高了将近60%。
4K分辨率下,RTX 4080终于达到了300W的水准,《绝地求生》功耗依然最好,为304W,但是帧率比RTX 3080高了60%。
文章来源:快科技