
英伟达GeForce RTX 4060将是下一代高端游戏显卡,提供基于 Ada Lovelace GPU 的最新图形架构。该显卡将取代RTX3060,这是一款在 300 至 400 美元的美国市场中非常流行的游戏显卡。
英伟达GeForce RTX 4070 显卡 - 专为游戏发烧友设计
虽然不可否认的是对高端GeForce RTX 4090、GeForce RTX 4080和GeForce RTX 4070的热情系列显卡提供最佳游戏性能,RTX 4060 系列显卡将围绕 300 美元至 400 美元的美国细分市场进行设计,这是一个主流价格范围,仍可提供大量性能。很简单,RTX 4090 系列的目标用户是想要最好的,而不用担心他们花多少钱,而 RTX 4080 系列的目标用户是希望以最优惠的价格获得最佳性能的用户。RTX 4070 将成为高端游戏的最佳选择,而 RTX 4060 专为游戏大众而设计,其性能价格不容忽视。
之前的 GeForce RTX 3060 被吹捧为比 RTX 2080 SUPER 有了巨大的改进。该卡最终确实达到了其承诺的性能目标,但与 RTX 2060 SUPER 相比最多提升了 25-30%。这主要是因为RTX 2060 SUPER已经是RTX 2060的升级版。但是从RTX 20系列开始,RTX 30就有了自己的Ti和Non-Ti两种口味。

RTX 3060 Ti 比 RTX 3060 快约 30%。RTX 3060 Ti 也比 RTX 2060 SUPER 快 30%,比标准 RTX 2060 快 40-45%。另一方面,RTX 3060 Non-Ti比 RTX 2060 SUPER 快 10% 左右,比 RTX 2060 Non-SUPER 显卡快 20%。因此,基于性能,RTX 3060 Ti 确实更快,但也更贵,但最终仍比其前身提供更好的价值。
例如,RTX 3060 Ti 和 RTX 2060 SUPER 的厂商建议零售价均为 399 美元,但 3060 Ti 的性能提高了 30%。同时,RTX 3060 Non-Ti 比 RTX 2060 Non-SUPER 便宜 20 美元,但性能提升了 20%。由于 RTX 3060 从未推出 Founders Edition 变体,大多数型号的零售价都在 15 美元到 20 美元之间,因此在一天结束时,您获得的价格与 RTX 2060 Non-SUPER 相同,但价格上涨了 20%。
英伟达做的一件事是说服游戏人群让其 RTX 3060 显卡配备 12 GB 内存,而不是 RTX 3060 Ti 上的 8 GB。这并没有太大改变性能,因为该卡具有较低的 192 位总线与 Ti 变体的 256 位总线相比,最终带宽较低。
我们也应该期待下一代游戏解决方案也会出现类似的情况,但需要考虑的一个重要因素是 GPU 变得越来越耗电且价格越来越高。随着我们获得更好的产品,这种趋势可能会持续到未来,但作为回报,最终消费者总是要付出代价。因此,从我们目前所知道的开始,首先我们应该看看全新的Ada Lovelace 或 AD10* 级 GPU,它们将为下一代 GeForce RTX 40 系列显卡提供动力。
英伟达的 AD106 'Ada Lovelace' GPU - 下一代强者
从 GPU 配置开始,英伟达GeForce RTX 4060 系列显卡可以同时使用 AD104 和 AD106 GPU。原因与当前 GeForce RTX 30 系列的情况相同,即 RTX 3060 Ti 基于 GA104 GPU,RTX 3060 基于 GA106 GPU。我们已经在这里详细介绍了 AD104 GPU,让我们来看看 AD106 GPU 及其提供的功能。据说 GPU 的尺寸约为 200 平方毫米,将采用台积电 4N 工艺节点,这是台积电为绿色团队设计的 5nm (N5) 节点的优化版本。

英伟达Ada Lovelace AD106 GPU 预计将配备多达 3 个 GPC(图形处理集群)。这与 GA106 GPU 的 GPC 计数相同。每个 GPU 将由 6 个 TPC 和 2 个 SM 组成,与现有芯片的配置相同。每个 SM(流式多处理器)将容纳四个子内核,这也与 GA106 GPU 相同。改变的是 FP32 和 INT32 核心配置。每个子核将包括 128 个 FP32 单元,但组合的 FP32+INT32 单元将达到 192 个。这是因为 FP32 单元与 IN32 单元不共享相同的子核。128 个 FP32 内核与 64 个 INT32 内核是分开的。
所以总的来说,每个子核心将由 32 个 FP32 加上 16 个 INT32 单元组成,总共 48 个单元。每个 SM 将总共有 128 个 FP32 单元加上 64 个 INT32 单元,总共 192 个单元。由于总共有 36 个 SM 单元(每个 GPC 12 个),我们正在查看 4,608 个 FP32 单元和 2,304 个 INT32 单元,总共 6,912 个内核。每个 SM 还将包括两个 Wrap Schedules(32 线程/CLK),每个 SM 有 64 个 wrap。与 GA102 GPU 相比,核心 (FP32+INT32) 增加了 50%,Wraps/Threads 增加了 33%。
英伟达AD103 'Ada Lovelace' 游戏 GPU 'SM' 框图:

转到缓存,这是英伟达对现有 Ampere GPU 的另一个重大推动。Ada Lovelace GPU 将为每个 SM 打包 192 KB 的 L1 缓存,比 Ampere 增加 50%。如泄漏中所述,L2 缓存将增加到 32 MB。这比仅托管 3 MB 二级缓存的 Ampere GA106 GPU 增加了 10.6 倍。缓存将在 GPU 之间共享。
最后,我们的 ROP 将保持在每个 GPC 16 个。您正在查看多达 48 个 ROP,与当前的 GA106 GPU 相同。Ada Lovelace GPU 上还将注入最新的第 4 代 Tensor 和第 3 代 RT(光线跟踪)内核,这将有助于将 DLSS 和光线跟踪性能提升到一个新的水平。总体而言,Ada Lovelace AD106 GPU 将提供:
- 与 GA106 GPU 相同数量的 GPC
- +20% 核心与 GA106 GPU
- 多出 50% 的 L1 缓存(与 Ampere GA106 相比)
- 超过 10 倍 L2 缓存(与 Ampere GA106 相比)
- 相同数量的 ROP(与 Ampere GA106 相比)
- 第 4 代张量和第 3 代 RT 核心
英伟达AD106“Ada Lovelace”游戏 GPU 框图模型:

请注意,据说在 2-3 GHz 范围之间的时钟速度没有被考虑在内,因此它们也将在提高每核性能(相对于安培)方面发挥重要作用。
英伟达GeForce RTX 4070 系列初步规格:

英伟达GeForce RTX 4060 显卡规格
正如我们在 GeForce RTX 3060 系列中看到的那样,英伟达可以有两种不同的 RTX 4060 系列显卡配置。我们实际上预计会有两种变体,RTX 4060 和 RTX 4060 Ti。现有一代看到 RTX 3060 Ti 和 RTX 3060 的发布相隔几个月,众所周知,这是一个批量细分市场,因此英伟达将利用优势定位两种解决方案,一种在 300 至 350 美元左右,另一种在 400 至 450 美元左右为主流游戏玩家马上开始。
目前,尚不清楚 AD104 GPU 是否会在 GeForce RTX 4060 系列中使用,因此,我们将重点关注将使用 AD106 GPU 的标准 RTX 4060。
英伟达GeForce RTX 4060“预期”规格
基于英伟达决定在其 RTX 4060 系列产品线中混合使用 AD104/AD106 或使用 AD106,我们可以看到缩减版的 RTX 4060 或具有完整配置的产品,而 Ti 可以使用缩减版的 AD104 配置。AD106 GPU 将配备 32 MB 的二级缓存和多达 48 个 ROP。
时钟速度尚未确定,但考虑到正在使用 TSMC 4N 工艺,我们预计时钟在 2.0-3.0 GHz 范围内。高于通常的时钟速度提升来自于英伟达正在实现两个节点的跳跃,考虑到三星 8nm 节点的 Ampere GPU 实际上是一个经过一些优化的 10nm 工艺节点。英伟达正在跳过 7nm 并直接采用 5nm 节点,甚至不是香草变体,而是它的优化版本。借助台积电 16nm 节点上的 Pascal,英伟达实现了巨大的频率飞跃,我们可以期待这次也有类似的飞跃。

至于内存规格,GeForce RTX 4060 预计将拥有 8 GB GDDR6X 容量,在超过 320 GB/s 的带宽下,128 位总线接口可能会以更快的 20+ Gbps 速度提供。'Ti' 变体,如果最终配备 AD104 GPU,则可以通过 192 位总线接口提供高达 12 GB 的内存。据说 GeForce RTX 4060 显卡的 TGP 为 220W,比 RTX 3060 增加了 30%,比 RTX 3060 Ti 增加了 10%。这是一个巨大的 TGP 增长,并且性能需要非常好才能让 英伟达保持其效率数字。

至于其功能集,英伟达GeForce RTX 4060 显卡将震撼所有现代 NV 功能集,例如最新的第 4 代张量核心、第 3 代 RT 核心以及最新的 NVENC 编码器和 NVCDEC 解码器,并支持最新的蜜蜂。它们还将包含所有现代 RTX 功能,例如 DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay 和 G-SYNC 支持。
英伟达GeForce RTX 4060 系列初步规格:

NVIDIA GeForce RTX 4060 显卡性能
至于游戏 GPU 的性能,我们只能在这里使用理论数据,因为距离发布有点远,但据我们所知,RTX 40 系列显卡可能是第一款达到 100 TFLOPs计算马力限制的游戏显卡.
只是为了比较:
- NVIDIA GeForce RTX 4090 Ti: ~103 TFLOPs (FP32)(假设 2.8 GHz 时钟)
- NVIDIA GeForce RTX 4090: ~90 TFLOPs (FP32)(假设 2.8 GHz 时钟)
- NVIDIA GeForce RTX 4080: ~50 TFLOPs (FP32)(假设 2.5 GHz 时钟)
- NVIDIA GeForce RTX 3090 Ti: 40 TFLOPs (FP32)(1.86 GHz 升压时钟)
- NVIDIA GeForce RTX 4070 Ti: ~38 TFLOPs (FP32)(假设 2.5 GHz 时钟)
- NVIDIA GeForce RTX 4070: ~36 TFLOPs (FP32)(假设 2.5 GHz 时钟)
- NVIDIA GeForce RTX 3090: 36 TFLOPs (FP32)(1.69 GHz 升压时钟)
- NVIDIA GeForce RTX 3080: 30 TFLOPs (FP32)(1.71 GHz 升压时钟)
- NVIDIA GeForce RTX 3070 Ti: 22 TFLOPs (FP32)(1.77 GHz 加速时钟)
- NVIDIA GForce RTX 4060: 20 TFLOPs (FP32)(假设 2.2 GHz 时钟)
- NVIDIA GeForce RTX 3070: 20 TFLOPs (FP32)(1.72 GHz 升压时钟)
- NVIDIA GeForce RTX 3060Ti: 16 TFLOPs (FP32)(1.65 GHz 加速时钟)
- NVIDIA GeForce RTX 3060: 13 TFLOPs (FP32)(1.77 GHz 升压时钟)
基于 2.2 GHz 的理论时钟速度,您可以获得高达 20 TFLOPs 的计算性能,并且有传言暗示更高的升压时钟。现在,这些听起来绝对像峰值时钟,类似于 AMD 的峰值频率,高于平均“游戏”时钟。20+ TFLOPs 计算性能意味着“60 级”GPU 上的性能比“70 级旗舰”更高,这将是一个很好的提升。但是应该记住,计算性能并不一定代表整体游戏性能。

这将使 GeForce RTX 4060 显卡的计算性能与其前身相比提升约 54% ,这甚至没有考虑到 RT 和 Tensor 核心性能,预计它们各自的部门也将获得重大提升。现在 FLOP 不一定反映图形或游戏性能,但它们确实提供了可用于比较的指标。

游戏玩家应该期待出色的 1080p 甚至 1440p 游戏在这些显卡和 DLSS 上都非常流畅。'60' 系列一直以高端 1080p 和主流 1440p 游戏为目标,但预计这些卡将在电子竞技中真正流行,其技术包括 Reflex、DLSS 和各种流媒体功能,处于主流价位。
NVIDIA GeForce RTX 4060 显卡价格和可用性
NVIDIA GeForce RTX 3060 的售价为 329 美元,而 RTX 3060 Ti 的售价为 399 美元。我们可以期待 NVIDIA 将这些卡的价格保持不变,并在此处和那里进行 10 至 20 美元的美国定价调整。
NVIDIA 确实需要在 300 至 400 美元的美国市场中吸引更多的游戏玩家,但他们必须提供物有所值的产品。RTX 3060 Ti 是一款不错的产品,而 RTX 3060 被证明与 AMD Radeon RX 6600 系列相比极具竞争力。现在将由 NVIDIA 来决定他们是想保持主流王者的地位,还是走一条不符合游戏玩家和他们自己利益的路线。

有传言称 NVIDIA GeForce RTX 40 系列显卡将在第三季度发布,预计将于 2022 年第四季度发布,因此我们将确切知道 NVIDIA 在未来几个月内将做什么。
NVIDIA GeForce GPU 分段/等级价格
