纵观Steam硬件排行榜,NVIDIA GeForce的60尾缀GPU不讲道理的霸榜已久,GTX 1060、RTX 2060、RTX 3060,甚至RTX 3060 Laptop GPU在TOP 10中都占有不少的份额。而出于性价比考虑,大多数玩家会选择3-5年为周期更新硬件,这意味着GTX 1060、GTX 1660以及RTX 2060玩家们已经开始考虑游戏硬件升级了。

定位1080p流畅高画质游戏的GeForce RTX 4060在此刻提前上市显然很合时宜。面对日渐复杂的光线追踪特效,1080p分辨率流畅运行仍然是主流需求,更何况3-5年前开始流行的1080p高刷显示器表现仍然良好。这时候,MSRP 2399元的GeForce RTX 4060自然增添了不少吸引力。

更重要的是整个游戏生态也在发生翻天覆地的变化。RTX GPU刚推出时,只有37%的RTX 20系列玩家启用光线追踪,26%的人启用DLSS。现在有超过400个RTX加速的游戏、应用和数以百万计的RTX玩家。而在当下,83%的RTX 40系列游戏玩家启用光线追踪,79%的人启用DLSS,RTX技术的普适性已经成为了业内共识。
DLSS与RTX下一阶段的普及重任落到了GeForce RTX 4060身上。与RTX 30上市初期开卖即断货的尴尬局面不同,如今MSRP定价已经可以轻松在官方电商平台下手。随着GeForce RTX 4060增大L2缓存,并拥有电竞游戏低延迟响应、DLSS超采样提升帧率,以及强大AI性能的特性,GeForce RTX 4060很好的奉行了甜点显卡的重任。

由于公版Founders Edition的缺席,iGame GeForce RTX 4060 Ultra W DUO 8GB成为首发阵营的主角。也恰好是今年,iGame开始不断尝试MSRP价格,让性价比更为凸显。那么GeForce RTX 4060是否真如主流玩家们所期望那般成为游戏PC升级的重要理由?GeForce RTX 4060首发评测就此奉上。

用AD107戳中甜点
虽然与GeForce RTX 4060 Ti同时现身,但GeForce RTX 4060采用了面积更小的AD107核心,型号AD107-400-A1,Die size 146mm²,搭配8GB 128-bit GDDR6显存使用。另外AD107还会有应用于移动端的GN21-X4变体,即GeForce RTX 4060 Laptop GPU。但由于频率、笔记本调教方式和定位不同,故没有太多对比参考价值。

AD107同样使用了NVIDIA最新的Ada Lovelace架构,台积电4N英伟达定制工艺,在146mm²的芯片面积中同样保存了完整的架构设计,即GPU中包含了若干个GPC(Graphics Processing Clusters,图形处理集群),GPC下包含若干个TPC(Texture Processing Clusters,纹理处理簇),再往下就是SM、CUDA、RT Core、Tensor Core等等。
GeForce RTX 4060的AD107已经是完整的架构,拥有3个GPC,每个GPC包含4组TPC,而非AD106的6组。

与此同时,GeForce RTX 4060其他结构则保持不变,即每组TPC包含2个流式多处理器(Streaming Multiprocessors,SM)。其中每个SM包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。另外每个SM下的128个CUDA Core随处理块分成4组,每组CUDA由16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core组成。
GeForce RTX 4060的L2缓存相对RTX 30以前GPU的巨大提升,来到了24MB,是GeForce RTX 3060 12GB和GeForce RTX 2060的3MB L2的8倍。

由于紧贴着核心,L1缓存设计决定了存储空间不可能做得太大,所以提升L2缓存容量就称为了理想选择。更大的L2缓存有助于提高随机存取的命中率,更快的L2缓存能提升运算单元的效率。内核在计算的过程中会不断的调用存储子系统的数据,顺序是L1缓存、L2缓存、显存、内存,越往后响应速度越慢。为了赶上快速刷新的游戏画面,GPU所有的数据会经过预加载放置在缓存中,因此缓存容量越大,下一帧所需要素材的命中率就越高,GPU跑腿寻找数据所需要的时间就更短,效率就更高。


同样,GPC都需要通过L2缓存完成所有访存操作,即Ada Lovelace架构中的*四代第**Tensor Core和第三代RT Core性能提升也会通过L2缓存实现。正因为如此,在单元数量、显存带宽没有优势的情况下,GeForce RTX 4060依然能轻松超越前辈。
这里奉上对比表格:

除此之外,Ada Lovelace架构还为第三代RT Core带来了更多的射线/三角形求交测试吞吐量,并并额外增加了透明度微图引擎(Opacity Micro-Map,OMM)和位移式微型网面引擎(Displaced Micro-Mesh,DMM),引入了着色器执行重排序(Shader Execution Reordering,SER)技术,通过与游戏设计团队配合,更有效的分配次级射线的排序权重。

*四代第**Tensor Core则配合新光流加速器、NVIDIA Reflex等技术组成了DLSS 3。更确切的说,DLSS 3是一套包含了提升游戏帧率、降低系统延迟的完整解决方案。它通过引入光流加速器(Optical Flow Acceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,将卷积自编码器的输入源扩展到几个部分,分别是:之前帧与当下帧,由光流加速器生成的光流场、游戏运动矢量和深度等数据。这时候DLSS 3甚至承担起渲染过程中7/8的工作,让CPU和GPU进完成其中1/8的渲染即可,从而节省出大量的计算资源专注到更有用的地方。

另外值得注意,GeForce RTX 4060的AD107中依然包含了1个NVNEC和1个NVDEC,也意味着GeForce RTX 4060与GeForce RTX 4060 Ti、与GeForce RTX 4070一样,拥有完整的视频编解码能力。特别是AV1编码器能够利用现阶段可以进行1080p串流视频的带宽。同时掌握AV1编解码器也意味着GeForce RTX 4060 Ti 8GB无论是*放播**还是输出,都拥有不错的表现,其中AV1编码器能比H.264编码器效率高出40%。

再遇iGame
至此,GeForce RTX 4060的核心元素集齐,让我们把目光聚焦到GPU的外观上。由于首发没有Founders Edition设计,iGame GeForce RTX 4060 Ultra W DUO 8GB成为了不错的选择,它不仅符合MSRP的2399元定价,白色主题搭配波普渐变色外观也更好的符合时下流行的白色系搭配。

iGame Ultra新的波普(POP)艺术风格起源于上个世纪50年代,通过撞色运用及随性的线条勾勒,打造出拥有极强物质主义及乐观精神。在变换角度时,会发现彩色部分会虽不断变换呈现出色彩斑斓的效果。

其中双风扇设计让显卡长度控制在了255mm范围之内,而如果观察PCB会发现实际显卡长度可以更短,考虑到GeForce RTX 4060对功耗有着很好的控制,自然也期待未来AIC可以推出更小尺寸的版本,方便塞入小型机箱中。

另外iGame GeForce RTX 4060 Ultra W DUO 8GB的电源接口也回到了传统的8pin形态,而非最新的16pin(12VHPWR)接口,很好的考虑到老款PC升级的兼容性。

在散热设计上,iGame GeForce RTX 4060 Ultra W DUO 8GB使用了2个90mm双环形扇叶可以做到叶片环环相连,提升风扇强度。同时风扇内部使用了双滚珠轴承设计,帮助风扇可以柔滑流畅运行,并延长风扇的使用寿命。

为了提升导热效率,风扇下方使用了一套大面积的散热鳍片以加速导热效率,比如采用了2x6mm热管,另外回流焊也确保了热管和鳍片紧密接触,以获得更好的散热效能。同时iGame GeForce RTX 4060 Ultra W DUO 8GB金属背板也使用了与iGame Ultra波普风格相呼应的白色主题设计。

因此在实际压力测试下,iGame GeForce RTX 4060 Ultra W DUO 8GB的散热表现不错,GPU核心温度在58℃左右。如果通过红外线测温,在室温26℃的环境中,可以看到显卡表面保持着清凉的状态。

事实上GeForce RTX 4060功耗控制得不错,例如在待机状态下整体功耗控制在10W以内,而平均游戏功耗在110W左右,这里我们抓取了数款游戏实际运行过程的平均功耗表现,足以见得115W TGP已经完全够用了。

有意思的是,NVIDIA也对GeForce RTX 3060和GeForce RTX 4060每周所产生功耗与电费做了统计,110W功耗的GeForce RTX 4060相对RTX 3060可以节省将近35%的费用。对于家用玩家而言,4年节省上百元似乎意义不大,但对于动辄上百台60系列GPU的电竞酒店和网吧业主,35%电费的节省可是一个不小的数额。

最后在挡板设计上,GeForce RTX 4060提供了3个DisplayPort 1.4a和1个HDMI 2.1接口,iGame再次基础上还提供了一个物理固件切换按钮,限于MSRP定价,iGame GeForce RTX 4060 Ultra W DUO 8GB没有提供官方一键超频功能。不过超跑还可以通过iGame Center进行进一步的频率设置。鉴于GeForce RTX 4060的低功耗与相对冗余的散热设计,通过超频换取更多的性能提升也是个不错的选择。

光追游戏酸爽了
收集完GeForce RTX 4060的所有条件让我们来到喜闻乐见的跑分与游戏测试环节。这次硬件平台包括Core i9-13900K,七彩虹Colorful CNV DDR5-6600 16GB x2,CVN Z790D5 GAMING FROZEN V20,以及1250W电源作为支持,同时也引入GeForce RTX 3060,GeForce RTX 2060作为对比。


鉴于GeForce RTX 4060定位在1080p级别,因此在实际测试中主要围绕1080p最高光线追踪画质进行。另外需要注意,GeForce RTX 4060使用的是PCIe 4.0 x8通道,通过PCB观察会发现引脚的后半部分是没有电路的。因此GeForce RTX 4060也只有在显卡槽支持PCIe 4.0以上版本时性能会被充分发挥,如果安装在PCIe 3.0 x16插槽中,性能会有明显影响。

在基础测试部分,这里使用3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal进行对比。GeForce RTX 4060的表现非常亮眼,相对GeForce RTX 3060 12GB性能提升有15%到22%,如果是GeForce RTX 3060 8GB,差距无疑会更大。与此同时,GeForce RTX 4060相对GeForce RTX 2060提升更是40%以上。

在常规非DLSS 3游戏测试中,我们选择了《刺客信条:英灵殿》和《看门狗:军团》这样的开放世界,也有《生化危机4》重置版。可以看到GeForce RTX 4060相对GeForce RTX 3060 12GB性能提升15%到21%,相对GeForce RTX 2060提升幅度上就相当大了,可以从35%到152%不等。


接下来开启光线追踪最高画质加DLSS 3才是重头戏,RTX生态发展的5年中,已经获得了超过400款游戏的支持,其中会有79%的RTX 40系列用户开启DLSS,83%的RTX 40系列用户开启光线追踪。
不仅如此,在DLSS 3发布数个月内,支持的游戏和应用已经超过30款,增长速度更快,提升效果也更明显。但前提是必须要有一块GeForce RTX 40系列GPU中的*四代第**Tensor Core提供硬件支持,此前的Tensor Core最高只能支持到DLSS 2.X。

GeForce RTX 4060无疑将拥有DLSS 3技术的门槛下降了一大截,在3DMark DLSS功能测试中,可以看到GeForce RTX 4060相对GeForce RTX 3060 12GB在2K分辨率下提升了84%,4K分辨率下提升了109%。而相对GeForce RTX 2060,2K分辨率下提升了113%,4K分辨率提升了157%。可见DLSS 3帧生成在其中起了很大的作用。

在DLSS 3游戏测试环节。同样是在1080p分辨率下开启光线追踪最高画质,可以看到《极限竞速:地平线5》中GeForce RTX 4060相对GeForce RTX 3060 12GB提升了63%的帧率,相对GeForce RTX 2060则提升了211%。


再比如《漫威蜘蛛侠:迈尔斯》中,GeForce RTX 4060相对GeForce RTX 3060 12GB提升了65%的帧率,相对GeForce RTX 2060则提升了132%。


《赛博朋克2077》和《巫师3:狂猎》在开启光线追踪高画质后,让DLSS 3的加持显得非常重要。GeForce RTX 4060相对GeForce RTX 3060 12GB提升超过了110%,相对GeForce RTX 2060则提升了200%。


另外由于DLSS 3本身自带NVIDIA Reflex技术,不仅解决了AI插帧的时候避免关键操作和关键帧排在渲染序列尾端,同时也默认开启了游戏高速响应的节奏,在DLSS 2.X时代,这个选项需要游戏单独支持,并需要开启独立的选项才能实现,而现在则可以直接运用在DLSS 3游戏中。同时目前主流的10款射击类游戏中,也已经有8款游戏提供了对NVIDIA reflex的支持,比如《Apex英雄》, 《使命召唤: 战区2》, 《命运2》, 《逃离塔科夫》, 《堡垒之夜》,《彩虹六号:*攻围**》和《无畏契约》等。

AI与创作一样不落
DLSS 3的影响已经不局限于游戏,部分专业软件已经开始率先支持DLSS 3特性,国产的D5渲染器便是其中之一。D5渲染器作为一款基于Unreal Engine开发的专业软件,在更新速度、新技术支持表现得非常积极,再加上易上手的特性,可以在上手数个小时内就能掌握使用的要领,并直接投入到工作中,对新手和有经验的用户都非常有好。

在近期的更新中,D5渲染器追加了DLSS 3实时高帧率的支持,这让操作中的实时预览有了更流畅的体验。

这里同样使用GeForce RTX 4060与GeForce RTX 3060 12GB、GeForce RTX 2060进行对比,选用软件自带的Minimalist Living Room,以及额外*载下**的Wooden Atrium Space场景进行对比。其中Minimalist Living Room拥有31个模型和4,065,155个表面,以及2个光源。Wooden Atrium Space则更为庞大一些,拥有288个模型,62,204,588个表面和30个光源。
这里直接对DLSS 3环境进行对比,GeForce RTX 3060 12GB、GeForce RTX 2060由于无法开启DLSS 3实时高帧率选项,因此实际帧率表现被甩开数条街。GeForce RTX 4060相对GeForce RTX 3060 12GB提升超过120%,相对GeForce RTX 2060提升超过220%。

另外一个则是时下的热门的AI创作软件Stable Diffusion 2.1,这里我们仍然沿用此前的设置,让GPU同时运算2张图片,总共运行10次,即20张。每张图片分辨率为768x768分辨率,采样步数设置为50。通过记录每个GPU花费的时间,并进一步推算出每分钟生成的图像效率(Images Per Minute)。

在Stable Diffusion 2.1中,GeForce RTX 4060的AI性能相对GeForce RTX 3060 12GB提升14%,相对GeForce RTX 2060提升47%。

然后是利用ON1 Resize AI 2022提升图片的原生分辨率,同样考验的是各GPU的AI性能,并记录GPU的用时,用时越少越好。在Ferris Wheel、Glasses、Bicycle、Motorcycle、Leaf五个图片场景中,GeForce RTX 4060相对GeForce RTX 3060 12GB节省15%的时间,相对GeForce RTX 2060节省36%的时间。


即使没有*四代第**Tensor Core加持,GeForce RTX 4060表现也仍然强劲,例如V-Ray 5 Benchmark中,会分别对CUDA Core和RTX进行检测。在CUDA Core表现上,GeForce RTX 4060相对GeForce RTX 3060 12GB提升45%,相对GeForce RTX 2060提升144%。而在RTX光追性能中,GeForce RTX 4060相对GeForce RTX 3060 12GB提升50%,相对GeForce RTX 2060提升143%。

在测试GPU的光线追踪性能Octane Render RTX benchmark中,GeForce RTX 4060相对GeForce RTX 3060 12GB提升23%,相对GeForce RTX 2060提升88%。


另外喜闻乐见的Blender Benchmark主要检测了Moster、Junkshop、Classroom三个输出场景,GeForce RTX 4060相对GeForce RTX 3060 12GB提升40%,相对GeForce RTX 2060提升80%以上。

工程专业常见的SPECviewperf 2020。这是一款包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计领域的专业软件图形测试,包括包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。这里GeForce RTX 4060相对GeForce RTX 3060 12GB平均提升30%,相对GeForce RTX 2060平均提升40%。

写在最后:甜点新标杆
在测试过程中,GeForce RTX 4060在性价比上着实给人眼前一亮,仅基础性能就可以比GeForce RTX 3060 12GB提升20%以上,相对GeForce RTX 2060提升50%以上,如果获得DLSS 3加持,效率则是成倍的增加,2399元的定价无疑让GeForce RTX 4060看起来很有诚意。追求性价比的游戏玩家,注重能耗的电竞酒店,网吧业主都完全可以把GeForce RTX 4060当成首选项。

GeForce RTX 4060给予的3A大作体验是没有折扣,除了部分对光追性能及其严苛的游戏,绝大部分主流游戏和电竞游戏已经能够轻松在1080p最高画质下跨过100FPS台阶,充分发挥1080p高刷显示器的性能。并且绝大部分游戏体验是GeForce RTX 4060在游戏中仅以平均110W功耗以内实现的,也足以证明GeForce RTX 4060的超频潜力。
另外诸如iGame GeForce RTX 4060 Ultra W DUO 8GB在散热设计上加码的AIC产品,也从侧面证明了GeForce RTX 4060还拥有更多等待被挖掘的潜力,因此我们也完全有理由期待AIC厂商们在非MSRP上给予的性能释放。

在供货充足的当下,以战斧的价格入手一款iGame GeForce RTX 4060 Ultra W DUO 8GB这般的显卡,戳中游戏和创作性能的甜点,在1080p分辨率下游刃有余的工作与玩耍,以最便宜的价格跨进GeForce RTX生态圈,如此甜点的GeForce RTX 4060,着实找不出什么拒绝的理由了。
