在经历了改名风波后,GeForce RTX4070Ti系列终于与我们见面了,每当有这种新卡发售,笔者总是会下意识地去关注一下耕升推出的非公版,因为它们总能在保证性能释放的基础上,击穿价格的底线。
也是提前收到了耕升的GeForce RTX4070Ti追风EX,看看它的表现究竟如何,能否成为高端玩家的性价比之选。在本次测试中,我们尝试使用一套高端AMD配置来测试,具体配置如下:
(资料图片)
外观设计
耕升GeForce RTX4070Ti追风EX是一张标准的3槽的大型显卡,整体设计紧凑,三围仅327*137*62mm,可以塞进大部分MATX机箱。
GeForce RTX4070Ti追风EX采用三风扇设计,每个风扇有9片白色扇叶组成,中间用追风系列的Logo点缀,四周的包边如同嶙峋的黑曜石。
GeForce RTX4070Ti追风EX的背板为金属材质,采用穿透式设计,挖出了大面积的镂空,方便散热器直接吹透。
显卡背板最外圈是一层塑料的黑色包边,上方印有Geforce RTX的标识,右侧的耕升LOGO提供了RGB灯光功能,可以使用“神同步灯光”功能实现灯效同步,也可以在控制软件中自定义颜色和亮度。
供电方面,它采用最新的ATX3.0规范的16Pin供电接口,随包装内附赠了2*8Pin转16Pin的转接头,这意味着GeForce RTX4070Ti追风EX的功耗是非常低的,电源兼容性也非常好,常规电源的双8Pin输出即可带动。
I/O接口挡板采用银灰配色,接口方面配备了3*DP1.4接口和1*HDMI2.1接口,最高支持8K60帧输出。
核心 解析
耕升GeForce RTX4070Ti追风EX的核心与RTX4080的AD103不同,它基于AD104 核心打造的,里面有5组满血的GPC,内 部共有 7680个 CUDA核心、240个 Tensor核心、60个第三代RT核心和80个ROP单元, 起名叫RTX4070Ti确实是比较恰当的。
RTX4070Ti的默认频率是2610MHz,而耕升GeForce RTX4070Ti追风EX核心频率是2655MHz,看来是进行了一些出厂预超频。显存方面则是192-bit位宽的12GB GDDR6X。从上述定位中我们可以看出,RTX4070Ti是比较适合4K游戏的高端显卡。
耕升GeForce RTX4070Ti追风EX同样采用了最新款的NVIDIA Ada架构,它基于TSMC4N NVIDIA定制工艺打造,因此实现了高达2倍的性能功耗比飞跃。流式多处理器的 吞吐量超过上一代产品2倍。第三代RT Cores的有效光线追踪计算能力是上一代产品2.8倍。第四代Tensor Cores新增FP8引擎,具有高达1.32petaflops的Tensor处理性能,超过上一代的5倍。SER为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。
反映到具象的功能上,新架构带来了不少的新功能:由于Ada光流加速器的引入,使得DLSS3能够预测场景中帧和帧之间的运动变化,实现AI插帧,在保持图像质量的同时提高帧率。同时支持双AV1编码器的应用,不仅可以将视频导出时间缩短,还能拥有更好的画质。
理论 性能
接下来我们进行理论性能测试环节。首先是单烤甜甜圈,烤机15分钟后,核心温度稳定在67. 9℃左右,功耗稳定在285W 左右,与其它的非公都是一样的。这个功耗可以说是相当低,一般600W以上的电源就更稳了,官方推荐750W以上。最关键的是,它仅需2个8Pin输出就可以正常使用,这意味着有升级想法的玩家们,完全不需要换电源。
接下来进行3DMark压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般97%以上才算合格的显卡。实测耕升GeForce RTX4070Ti追风EX的得分为99.2%,完美通过测试。
在 3DMark TimeSpy DX12测试中,显卡分数达到了21407分,作为对比,公版RTX4080的分数为26552分,GeForce RTX308010G版的分数为17306分,RTX3090的分数为18981分,RTX3090Ti为21439分。可以看出耕升GeForce RTX4070Ti追风EX的DX12分数与RTX3090Ti咬得非常紧,可以说RTX4070Ti的物理性能约等于RTX30系列最旗舰的卡,功耗还低了不少,这一带能效比提升确实明显。
在 3DMark Fire Strike Extreme DX11测试中,耕升GeForce RTX4070Ti追风EX显卡分数达到了26195分,作为对比,GeForce RTX3090Ti为26111分 ,RTX4070Ti同样与RTX3090Ti表现出了更强劲的DX11性能。
而 在3DMark Portal Royal光追测试中,耕升GeForce RTX4070Ti追风EX获得了13697分,就没有RTX3090Ti的14819分强了,可能是12G显存大小和192bit显存位宽的劣势带来的光追性能的差距。
制作了一份GPU理论分数的对比表,在大部分项目中,耕升GeForce RTX4070Ti追风EX相比于上代旗舰卡RTX3090Ti都非常接近,但功耗却少了一半,可以说RTX4070Ti是一张很适合4K游戏玩家的卡,也是一张升级成本很低的卡。
游戏实测
接下来,我们就进行一下游戏实测,看看RTX4070Ti能否通吃4K下的3A大作。以下项目我们均在4K分辨率最高特效下进行测试,首先是电竞游戏,我们选取了《CS:GO》和《守望先锋》:归来两款主流的FPS游戏进行测试。在CSGO中运行自带的BenchMark,平均帧达到了207.7帧,可以满足4K高帧畅玩的需求,显卡完全不会成为瓶颈。
《守望先锋》:归来实测在4K最高画质下能跑到289-299帧左右,完美适配300Hz高端电竞显示器。
此外,在《守望先锋》中还提供了Nvidia Reflex技术的支持,可以减少外设的操作延迟和显卡的渲染延迟,进一步提升射击手感。从我们的测试数据中可以看出,开启Nvidia Reflex后整体延迟降低了近10ms,这对于高端玩家们来说已经是可以感知的了。
接下来我们测试几款经典3A大作,在《古墓丽影:暗影》中,即便不开启DLSS,也能在4K分辨率最高画质下跑到平均105帧,轻松实现流畅游玩。
在开启性能档DLSS后,帧率更是暴涨到了平均171帧,能满足4K165Hz显示器畅玩3A的需求。
而在《荒野大镖客2:救赎》中,也可以在4K最高画质下运行在平均75帧,流畅游玩也不成问题。
在开启DLSS性能档后,帧数进一步提升到了105帧,游戏体验非常顺畅。
而在4K光追游戏中,压力就比较大了。比如光追3A大作《控制》。
不开DLSS的话,只有平均30帧,没法流畅游玩。但如果我们开启性能档DLSS,帧数直接了将近翻3倍,达到了平均87帧,完全可以流畅游玩了。
即便是上述这些只支持DLSS2的老游戏,都有如此惊艳的帧数提升,更别提它还可以通过最新的DLSS3技术实现帧数的进一步暴增。DLSS3是一款由AI驱动的性能倍增技术,由全新第四代Tensor Core和GeForce RTX40系列GPU的全新光流加速器驱动,是NVIDIA广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启NVIDIA RTX神经网络渲染游戏和应用的新时代。
简单地说,过去的DLSS2是通过渲染出一个低分辨率图像,然后AI放大至高分辨率,实现画质与帧数的提升。而全新的DLSS3在兼容DLSS2的基础上,还新增了帧生成功能,可以在两个真实帧之间插入AI推算出来的全新帧,实现帧数的倍增。再结合DLSS2的超分辨率功能,AI能重建至多八分之七的显示像素,与没有DLSS相比,游戏性能最高可提升4 倍!
我们先来看看压力最大的《赛博朋克2077》, 在4K最高画质超级光追下运行它自带的BenchMark,得到了以下数据。默认状态下只有22帧,完全无法流畅游玩,但在DLSS3选项全开的情况下,至多可以实现帧数4倍的提升。相比于同档位的DLSS2,帧数提升了26帧,这些帧数都是用AI技术“补”出来的。而在实际游戏中,开到DLSS3质量档就已经可以相当流畅的游玩了。
《巫师3》最近也更新了次世代版,但配置要求也是真的高,幸好它提供了DLSS3技术的支持,这对于RTX40系列显卡无疑是一个好消息。
在不开DLSS时,即便是我们这么高的配置,依旧只有平均24帧。而在开启DLSS2性能档后,帧数瞬间暴涨到了52帧左右。想要真正4K流畅游玩的话还是需要DLSS3技术的帮忙,在DLSS3平衡档下就可以满足全程65帧以上流畅游玩了。DLSS3性能下帧数最高可以实现近3倍以上的提升。
一进入《瘟疫传说:安魂曲》,我们就能感觉到它的细节特别出彩,当然对配置的要求也是非常高的。默认状态下难以4K流畅游玩,但是在DLSS3加持后依旧可以额实现帧数翻倍轻松畅玩。
在不开启DLSS的情况下,RTX4070Ti的帧数仅平均38帧,但在开启DLSS3性能后,帧数几乎翻了3倍,达到了平均114帧,满足了4K畅玩次世代3A大作的需求。
最后我们还测试了一款国产的横版光追游戏《生死轮回》,《生死轮回》虽然是横版游戏,但在RTX光线追踪技术的加持下画质相当爆炸,当然配置要求也是相当之高。
默认状态下同样只有平均27帧不到,但在开启DLSS3后,同样可以带来2.5倍的帧数提升,实现4K最高画质下85帧畅玩。
那么DLSS3技术就是十全十美的吗?当然不是。DLSS3的本质是AI生成全新帧,生成帧必定有一个副作用就是延迟的提高。毕竟我们鼠标是对我们看到的那一帧做出的反馈,而AI却会加上额外的帧,这个延迟的提高对于竞技游戏的影响是很大的。所以在打开DLSS3的帧生成功能时,NVIDIA Reflex会强制打开,尽量缩短生成帧带来的渲染延迟。我们以《瘟疫传说:安魂曲》为例,开启DLSS3后延迟反而比什么都不开还要低足足一半,这个技术的效果是立竿见影的。
创意生产
那么耕升GeForce RTX4070Ti追风EX能不能用于创意生产工作呢?答案当然是可以的。7680个强大的CUDA核心在应对创意生产和深度学习方面会有一定建树。同时它也 可以安装NVIDIA Studio驱动,有超过75款创意应用都 可以调用NVIDIA CUDA核心的AI算力,来大大提高工作效率。
在建模渲染类软件中,目前几乎所有的建模软件都会对NVIDIA的GPU有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具V-Ray中,可以借助RTX加速的光线追踪,实现高性能最终帧渲染。借助搭载AI的降噪功能,GPU可进一步加速交互式渲染。
接下来我们进行一下V-Ray Benchmark,实测GeForce RTX4070Ti追风EX获得了2292分,可以顺利应对大部分的建模渲染需求。
得益于光追性能的提升,GeForce RTX4070Ti追风EX在 V-Ray GPU RTX中的分数也提高到了3079分,也能应付一些试试光追的开发需求。
在主流的建模软件Blender中,GeForce RTX4070Ti追风EX也能有不错的表现,具体分数如下。这个成绩拿来做大部分复杂建模也不在话下了。
还为大家测试了另一款常用的渲染器Octane自带的BenchMark,可以看到它的渲染能力也是非常强的,在各项项目中,它的渲染能力都约等于4到10张GTX980的算力,不得不说这个进步是相当显著的。
在视频后期这一块,耕升GeForce RTX4070Ti追风EX同样配备第八代NVIDIA NVENC编码器,支持AV1编码和双编码器。AV1是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
为了检验它的视频渲染性能,还 为大家测试了PugetBench For Davinci以及Adobe全家桶。 实测GeForce RTX4070Ti追风EX在Davinci中最终分数可以达2320分,流畅应对4K剪辑调色不在话下。
在创意工作者们常用的Adobe Premiere中,我们开启GPU Cuda加速,然后使用PugetBenchmark进行测试。最终得分为1147分。
另外一款压力更大的视频特效软件Adobe Effects中,我们同样使用PugetBenchmark进行测试。最终得分为1415分,可见创意生产性能非常出色,能用来制作复杂的视频特效。
总结
从我们今天对耕升GeForce RTX4070Ti追风EX的测试来看,虽然它主打性价比,但它的性能释放也与其它更贵的RTX4070Ti非公卡无异。得益于先进的4nm制程,GeForce RTX4070Ti的功耗是相当低的,目前已经发布的所有RTX4070Ti非公卡都可以轻松压住,所以如果你买显卡追求的是更高的性价比,那么击穿低价的耕升GeForce RTX4070Ti追风EX绝对是很好的选择。
目前耕升GeForce RTX4070Ti追风EX也已经上市,感兴趣的话可以去各大电商平台了解一下。