IT之家也是提前收到了公版的 NVIDIA GeForce RTX 40 系列 GPU,在本次测试中,我们将利用一套高配 intel 配置来测试,只管即便避免显卡瓶颈。
详细配置如下:

NVIDIA GeForce RTX 4070评测:DLSS 3加持的狂暴机能小钢炮_技巧_显卡 文字写作

外不雅观设计

NVIDIA GeForce RTX 4070 的包装沿用了之前高端显卡的设计,给人一种“速率穿越”的觉得,但巨大的包装内,显卡却变得相称小巧。

显卡本体为标准的 2 槽设计,长度也只有 24cm 旁边,整体设计方正紧凑。
即便是 A4 构造的 ITX 机箱也可以轻松装下。

显卡的背板设计依旧延续了公版显卡的 X 型设计,金属风满满,低调不失落炫酷。

正面则是厚实的散热鳍片,整张显卡全金属的设计也有利于散热。

显卡风扇采取一左一右一上一下的独特排布办法,能形成垂直风道,更好地带走鳍片上的热量。

显卡外围环抱着一层银灰色的全金属包边,上方印有能干的 GeForce RTX 标识。

螺丝接口被设计在了右侧,整卡的一体感很强。

供电方面,它采取最新的 ATX3.0 规范的 16Pin 供电接口,随包装内附赠了 28Pin 转 16Pin 的转接头,事实上,它的 TGP 功耗仅 200W 旁边,理论上单 8Pin 的供电也能带动。
我们在装机时,最好利用支持 ATX 3.0 规范的电源,这样可以让机箱内更都雅。
如果一定要用转接线的话,用一根一分二 8Pin 的线就可以了。

I / O 接口挡板采取深灰配色,接口方面配备了 3DP1.4a 接口和 1HDMI2.1 接口,最高支持 8K60Hz 输出。

接口方面,NVIDIA GeForce RTX 4070 依旧是 PCIe 4.0 的接口,搭配主流主板均可开释全部性能。

核心解析

RTX 4070 与 RTX 4070Ti 相似,都是基于 AD104 核心打造的,但细节有所不同。
详细的核心代号为 AD104-250。
里面完全的 GPC 从 5 组变成了 4 组,内部共有 5888 个 CUDA 核心、184 个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单元,基本上可以理解为保留了 RTX 4070 Ti 80% 的核心规模。
不过招牌的 NVENC 单元从两个变成了一个。
这意味着它的视频编码能力是不如 RTX 4070 Ti 及以上的显卡的,但比较于上一代 RTX 3070 和 RTX 3070 Ti 则要强非常多。

RTX 4070 的 BOOST 频率是 2475MHz,默认频率为 1920MHz。
显存方面与 RTX 4070 Ti 保持同等。
都是 192-bit 位宽的 12GB GDDR6X,带宽也都是 21Gbps。
从上述定位中我们可以看出,RTX 4070 与 RTX 4070 Ti 一样,都是一张定位 2K 高帧率游戏的中高端显卡。

当然,GeForce RTX 4070 依旧采取了最新的 NVIDIA Ada 架构,基于 TSMC 4N NVIDIA 定制工艺打造,从而实现了高达 2 倍的性能功耗比飞跃。
它的流式多处理器吞吐量超过上一代产品的 2 倍,第三代 RT Cores 的光芒追踪打算能力更是提升了 2.8 倍。
此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。
而 SER 技能为光芒追踪带来了最高可达 3 倍的性能提升,整体游戏性能也可高达 25% 的提升。

新的 Ada 架构在详细功能上带来了许多新的特性:引入了光流加速器使得 DLSS 3 能够预测场景中帧与帧之间的运动变革,从而通过 AI 实现了帧天生技能,提高了帧率的同时保持图像质量。
此外,新架构还支持 AV1 编码器的运用,从而降落了视频的体积,并得到更好的画质。
同时,RTX VSR 功能的运用也使得实时视频超分辨率成为可能。

理论性能

我们在标题就有说到,RTX 4070 的功耗非常低。
详细能有多低呢?我们单烤甜甜圈测试一下就知道了。
烤机 15 分钟后,核心温度稳定在 66.4℃旁边,显存温度约 80℃。
整卡功耗仅仅 198W,乃至比 RTX 3070 还更低。
如果电源不虚标,CPU 配个 i5、R5 之类的百瓦 CPU,只要 450W 的电源都能带动整机了。
最关键的是,它仅需单根 8Pin 一分二输出线就可以正常利用(一些非公显卡乃至有单 8Pin 版本),这意味着有升级想法的玩家们,完备不须要换电源。
由于显卡体积特殊小,机箱也不用换了。

接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生低落,一样平常 97% 以上才算合格的显卡。
实测 NVIDIA GeForce RTX 4070 的得分为 99.6%,性能开释极其稳定。

在 3DMark TimeSpy DX12 测试中,显卡分数达到了 18140 分,这个成绩已经超越了 RTX 3080 10G,与 RTX 3080 12G 是基本相称的,可以说 RTX 4070 的 DX12 性能约即是 RTX 30 系列的高端显卡了,而功耗却仅仅只有一半。

在 3DMark FireStrike Extreme DX11 测试中,NVIDIA GeForce RTX 4070 显卡分数达到了 21497 分,同样与 RTX 3080 12G 附近,而功耗却小了 50%。

而在 3DMark Portal Royal 光追测试中,NVIDIA GeForce RTX 4070 得到了 11116 分,解释其光追能力约即是 RTX 3080 10G,也是能畅玩光追 2K 游戏的水平。

游戏实测

接下来,我们就进行一下贱戏实测。
值得一提的是,目前十大主流竞技射击游戏中随着《反恐精英 2》的加入,现已有九款支持 NVIDIA Reflex,这些游戏包括:《Apex 英雄》,《义务召唤: 战区 2》,《命运 2》,《逃离塔科夫》,《堡垒之夜》,《守望先锋》”归来”,《彩虹六号:围攻》和《无畏左券》,NVIDIA Reflex 能缩减操作延迟,提高相应速率,让跟枪更灵敏。
笔者希望即将更新起源 2 版本的 CS2,也能支持 NVIDIA Reflex 技能。

接下来笔者测试了两款经典 3A 大作。
《荒野大镖客 2: 救赎》在不开启 DLSS 的情形下,GeForce RTX 4070 能达到均匀 103.6 帧,已经能知足 2K 100 帧以上高帧畅玩了,这个体验无疑是非常出色的。

如果我们开启质量档的 DLSS,帧数会进一步提升到均匀 119 帧,并且此时画质险些没有丢失,体验很出色。

在另一款经典的 3A 大作《古墓丽影: 暗影》中,我们也得到了类似的答案。
在 2K 最高画质下运行自带的 BenchMark,已经能达到均匀 174 帧,知足 2K165Hz 屏幕的畅玩。

在开启 DLSS 后,帧数表现更佳,能达到均匀 206 帧,帧数提升了 30 多帧。
总的来说,RTX 4070 在传统 3A 大作中的表现是很靠近 RTX 3080 的。
更别说前代同级的 RTX 3070 Ti、RTX 3070 了。

以上这些只是开胃小菜,而 RTX 4070 的最吸引人之处在于其 DLSS 3 技能,可进一步提升帧率。
DLSS 3 是一款由 AI 驱动的性能倍增技能,采取了全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技能的最新版本,同时具备首创性的光学多帧生成功能,将为 NVIDIA RTX 神经网络渲染游戏和运用开启新的时期。

大略来说,过去的 DLSS 2 技能是通过渲染一个低分辨率图像,然后通过 AI 放大至高分辨率,从而提升画质和帧率。
而全新的 DLSS 3 技能在兼容 DLSS 2 的根本上,新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出的全新帧,从而实现帧率的倍增。
同时,结合 DLSS 2 的超分辨率功能,AI 能够重修多达八分之七的显示像素,与没有 DLSS 比较,游戏性能最高可提升 4 倍!

目前已经有超过 280 款 DLSS 游戏和运用发布。
个中共有 30 款已发布的 DLSS 3 游戏。
从发布进度来看,在 DLSS 2 和 DLSS 3 各自发布的前六个月中,DLSS 3 的采取速率比 DLSS 2 快 7 倍。
看来适配难度是相称低的,相信将来有越来越多的游戏适配 DLSS 技能。

我们先来看看压力最大的《赛博朋克 2077》在光追 + 2K 分辨率下的帧数情形,在默认状态下,RTX 4070 还是没有办法畅玩的,均匀帧数约 38 帧。
如果开启 DLSS 2 质量,帧数就可以达到均匀 69 帧畅玩了。
而如果开启 RTX 40 系列专享的黑科技 DLSS 3,瞬间暴涨到了均匀 103 帧,同时能知足不雅观感和流畅。

传奇 3A 大作《巫师 3:狂猎》最近也更新了次世代版,配置哀求大大提高,当然画质也跟上了潮流,放在如今也绝不后进。
同时它也供应了 DLSS 3 技能的支持,这对付 RTX 40 系列显卡无疑是一个好。

《巫师 3:狂猎》次世代版在 2K 分辨率不开启 DLSS 的情形下,GeForce RTX 4070 均匀仅有 38 帧,如果开启质量档 DLSS 2,就可以达到均匀 64 帧。
如果开启 AI 加持的 DLSS 3 技能,帧数就能暴涨到均匀 95 帧,大部分场景可以实现 2K 百帧畅玩了。

在另一款画质爆炸的次世代 3A 大作《瘟疫传说:安魂曲》中,优化相对来说就要好不少了。
即便不开启任何 AI 技能,也可以知足 2K 60 帧流畅嬉戏,而在 DLSS 3 加持后更是可以以电竞帧数畅玩。

实测 RTX 4070 在 2K 分辨率就已经能知足 71.2 帧畅玩了。
如果开启 DLSS 2 质量档,就能达到均匀 104.5 帧,如果开启 DLSS 3 插帧后,帧数更是会暴涨到均匀 147.2 帧,知足 2K144 高刷显示器的需求。

那么,代与代之间的 GPU 会有多大的提升呢?笔者这套配置换上 RTX 3070 Ti 测试了一套数据,看看隔代之间性能会有多少提升,在 DLSS 3 技能的加持下又会有多少提升。
实测不开启 DLSS 3 的情形下,RTX 4070 大约有 10% 的帧数上风。
如果开启 RTX 4070 系列独占的 DLSS 3 技能,帧数则领先了约 70%,这便是 AI 技能的魅力呀。

前面我们有提到过,RTX 4070 的功耗是相称低的,实际上一根 8Pin 供电就能带动。
因此我们还利用英伟达官方的 FrameView 工具统计了一下各个 3A 大作中的均匀功耗。
可以看出,大部分 3A 大作中 RTX 4070 的实际功耗都在 160-190W 旁边,如此低的功耗,意味着电源的选择上就很宽裕了,预算又可以省下一大笔,或许会成为万元机器的新选择。
而 ITX 爱好者们或容许以期待一下单风扇的 RTX 4070 小卡了。

创意生产

显存规模上,NVIDIA GeForce RTX 4070 与 RTX 4070Ti 的规格完备同等,都拥有 12G 的大显存,速率也达到了 21Gbps。
因此也被授予了一定的创意生产能力。
因此该显卡还支持安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意运用。
专有的 SDK 能使这些运用的运行速率更快,并供应独家功能,如 Optix、DLSS 和 Maxine。
NVIDIA Studio 全套创意运用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
同时大显存的加持也让它具备了一定的天生式人工智能的运算能力,拿来进行大略的 AI 绘画演习也是没有问题的。

在建模和渲染类软件中,NVIDIA GeForce RTX 4070 的 5888 个 CUDA 核心可以供应硬件加速,使得事情效率得以提高。
险些所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。
例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光芒追踪功能,实现高性能的终极帧渲染。
此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,供应更加流畅的事情体验。

我们也实测了一下 V-Ray Benchmark 的性能表现,GeForce RTX 4070 得到了 1847 分,可以应对大部分中等规模的建模渲染需求。

得益于光追性能的提升,GeForce RTX 4070 在 V-Ray GPU RTX 中的分数也提高到了 2631 分,也能搪塞一些中等负载的光追建模渲染需求。

在视频后期这一块,GeForce RTX 4070 同样配备了 NVENC 编码器。
并且 RTX 4070 也支持下一代视频编码技能 AV1,AV1 能够在占用相同空间情形下,供应更加快速的视频编码和更高质量的流媒体传输性能。
随着各大视频平台希望节约做事器流量用度,AV1 编码必将成为未来的主流编码办法。

NVIDIA 与多家行业互助伙伴密切互助,确保其 GPU 能够充分支持当今主流的多媒体运用。
目前,海内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速支持。
而常用的视频调色剪辑软件 DaVinci 也供应了 AV1 编码的支持。
这意味着 NVIDIA GPU 将来一定可以在处理视频编辑和渲染任务时充分发挥其 AV1 加速功能,供应更高效的性能和更流畅的事情体验。

IT之家还为大家测试了 PugetBench For Adobe 百口桶,看看它能否胜任视频剪辑事情。
实测 GeForce RTX 4070 在创意事情者们常用的 Adobe Premiere 中,我们开启 GPU Cuda 加速,然后利用 PugetBenchmark 进行测试。
终极得分为 1475 分,浏览韶光线上的 4K 视频毫无压力。

其余一款压力更大的视频殊效软件 Adobe Effects 中,我们同样利用 PugetBenchmark 进行测试。
终极得分为 1640 分,能用来制作一些比较繁芜的视效。

除了内容生产以外,在内容消费领域 RTX 4070 也有新功能。
那便是 RTX VSR 技能。
全称为 RTX Video Super Resolution(RTX 视频超分辨率技能)。
它可以通过 GPU 的 AI 打算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,目前这一技能已经适配了 Chrome 浏览器和 Edge 浏览器,后续也会适配以 VLC 为首确当地播放器。

RTX 视频超分辨率的利用非常大略,只要将 RTX 30 系列 / 40 系列的驱动程序更新到 531.14 以上版本,并将 Chrome / Edge 浏览器也更新到最新版本便可以启用。
启用路径为:NVIDIA 掌握面板 —— 视频 —— 调度视频图像设置。
此选项框下有四个档位可选。
档位越高超分辨率效果更明显,但也会花费更多的 GPU 资源。
目前它已支持海内的主流视频平台(哔哩哔哩、爱奇艺、斗鱼和虎牙等平台),以及一些国外的视频平台(Youtube、Twitch、Netflix、Hulu 和 Disney+)。

不才面的测试中,我们播放一条IT之家在哔哩哔哩发布的视频,分辨率调度为 480P,从最左边的原生 480P 分辨率超分后,后面的 1-4 档能看出更加清晰了,实际不雅观感媲美 4K。

↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4

除了 Edge 和 Chrome 浏览器以外,有名的 VLC 本地播放器也在 Beta 版中供应了 RTX VSR 技能的适配。
和网页一样,只要在驱动掌握面版中打开就可以了。
我们用一个 480P 确当地视频做演示,明显觉得右边更清晰了,后面大家欣赏本地电影时,也可以用这个技能进一步优化画质。

在最近大火的 AI 绘画(天生式 AI)中,RTX 4070 也有一战之地。
例如我们利用 stable-diffusion 的 v2-1_768-ema-pruned.ckpt 模型,考试测验绘制 20 张 AI 老黄的图像,RTX 4070 共计用时 2 分 18 秒。

而 RTX 3070 Ti 这边,则用时 2 分 57 秒,比较于 RTX 4070 的出图速率差距是相称明显的。
如果平时只是想大略玩玩 AI 的话,RTX 4070 就足以胜任了。
当然如果要繁芜的研究的话,那还是上 RTX 4090 或更高的 GPU 吧。

总结

笔者对付小而强大的东西一贯没有抵抗力,而 NVIDIA GeForce RTX 4070 正是这样一张如此小,又如此强大的小钢炮。
它的体积和功耗都比 RTX 3080 低 50% 旁边,但性能却非常靠近。
同时 DLSS 3、RTX VSR 等一系列 AI 技能的加持,能知足 2K 100+ 帧的畅玩,是一张很适宜 RTX 3070、RTX 2070Super 这个档位的玩家升级的一张卡。

如果你打算装一台紧凑型主机的话,那么公版的 NVIDIA GeForce RTX 4070 险些是现在最好的选择,首发的其它非公版 RTX 4070 都没有体积这么小的。
这张显卡将于 4 月 12 日晚发售,建议零售价 4799 元,感兴趣的话可以关注一下。