发新品、涨股价，英伟达帝国雏形尽显

4月13日，全球芯片大厂英伟达（NVIDIA）的年度好戏GTC 2021正式上演！

在这场95分钟的演讲中，NVIDIA首席执行官黄仁勋（Jensen Huang）一连发布多款重磅新品，涵盖GPU、CPU和DPU等多个方向，AI、自动驾驶、机器人、5G和数据中心诸领域无一不包。

可以说，NVIDIA在通向 “全领域芯片解决方案供应商” 的道路上即将行至目的地，庞大“芯片帝国”的根基已经建成。

发新品、涨股价，英伟达帝国雏形尽显

黄仁勋一头长发出镜

而好事成双的是，受益于数据中心和加密货币挖矿的强劲需求，NVIDIA还表示其第一季度营收将高于其早先预测的 53亿美元 。

该公司表示，NVIDIA支持加密货币挖矿的部门目前预计本季度的销售额将达到1.5亿美元，高于之前预测的5,000万美元。

受此利好消息影响，NVIDIA的股价在当日盘中大幅上涨近6%，收于608.36美元。 今年迄今为止，其股价已经上涨了16.5%。

八款新的GPU瞄准高性能

在今年的GTC 2021上，NVIDIA的看家业务GPU推陈出新，共发布了八款新的基于Ampere的图形处理单元（GPU）。

这八款GPU可用于 笔记本电脑、台式机、服务器 和 工作站 ，目标客户是数百万艺术家、设计师、工程师和虚拟桌面用户。

“混合工作已经是新常态，”NVIDIA专业可视化副总裁Bob Pette在一份声明中表示。“基于NVIDIA Ampere架构的RTX GPU为来自任何设备的工作负载提供了高性能处理能力。”

发新品、涨股价，英伟达帝国雏形尽显

RTX A4000 GPU

NVIDIA RTX A5000和NVIDIA RTX A4000 GPU定位于台式机，它们采用了全新的RT核心、Tensor核心和CUDA核心，将AI、图形和实时渲染的速度提高到前几代产品的 2倍。

对于专业人士来说，全新的NVIDIA RTX A2000、RTX A3000、RTX A4000和RTX A5000 GPU可以为笔记本电脑带来加速性能。它们包括最新一代的Max-Q和RTX技术。

发新品、涨股价，英伟达帝国雏形尽显

NVIDIA发布了八款新RTX GPU

在数据中心方面，NVIDIA展示了A10 GPU和A16 GPU。

A10为设计师和工程师提供了比上一代的虚拟工作站高 2.5倍 的性能表现；而A16 GPU则提供的用户密度则是上一代的 2倍，且总拥有成本更低，虚拟桌面基础设施体验也比上一代有所提升。

新的NVIDIA RTX台式机GPU和NVIDIA数据中心GPU将从本月晚些时候开始从全球分销合作伙伴和制造商处发货。新的NVIDIA RTX笔记本GPU将于今年第二季度预计在全球制造商的移动工作站中推出。

“全球首款TB级计算CPU”

除了GPU，NVIDIA心心念念的CPU也没落下，它发布了其Grace处理器。这是一款基于ARM架构的中央处理器（CPU），适用于大规模的人工智能和高性能计算应用。

Grace是以20世纪50年*开代**创计算机编程的Grace Hopper命名的，该CPU预计将于2023年初上市。

黄仁勋在发表主题演讲时表示，这是NVIDIA的第一款数据中心CPU，专门为大规模运行的应用而设计， “这是全球首款为TB级计算设计的CPU。”

通过使用ARM架构，Grace为训练巨型AI模型的系统提供了 10倍 的性能飞跃。而NVIDIA表示，瑞士超级计算中心和美国能源部洛斯阿拉莫斯国家实验室将率先使用Grace。

发新品、涨股价，英伟达帝国雏形尽显

Grace CPU

据了解，这款CPU的研发耗费了 1万名 工程师一年的时间。NVIDIA表示，这款芯片将满足世界上最先进的应用，包括自然语言处理（NLP）、推荐系统和AI超级计算的计算需求。

“前沿的人工智能和数据科学正在推动今天的计算机架构处理难以想象的数据量，”黄仁勋在演讲中说。“使用授权的ARM IP，NVIDIA将Grace设计为专门用于大规模人工智能和高性能计算的CPU。再加上GPU和DPU，Grace为我们提供了计算的第三项基础技术，以及重新构建数据中心以推进AI的能力。”

Grace是一款高度专业化的处理器，目标是训练下一代NLP模型等工作负载，这些模型的参数超过1万亿。

当与NVIDIA GPU紧密结合时，基于Grace的系统的性能将比今天基于NVIDIA DGX的系统（运行在x86 CPU上）快 10倍 。

发新品、涨股价，英伟达帝国雏形尽显

Alps超级计算机将使用NVIDIA的Grace CPU

Grace是为人工智能和高性能计算应用而设计的，但NVIDIA目前并没有披露更多关于Grace将用于何处的信息。NVIDIA也拒绝透露Grace芯片的晶体管数量。

随着AI模型的数据量和规模成倍增长，NVIDIA推出Grace。如今最大的AI模型包括数十亿个参数，并且每两个半月就会翻一番。训练它们需要一个新的CPU，可以与GPU紧密结合，以消除系统瓶颈。

“用经典的x86 CPU和GPU通过PCIe连接，很难解决这些问题。Grace专注于IO和内存带宽，与GPU共享主内存，不应该与AMD或英特尔的通用数据中心CPU相混淆。” Moor Insights & Strategies的分析师Patrick Moorhead说。

Grace性能的基础是*四代第**NVIDIA NVLink互连技术，该技术在Grace和NVIDIA图形处理单元（GPU）之间提供900千兆字节/秒的连接，与当今领先的服务器相比，可实现 30倍 的总带宽。

此外，Grace还将采用创新的LPDDR5x内存子系统，与DDR4内存相比，带宽将提高两倍，能效提高 10倍 。此外，新的架构还提供了统一的缓存连贯性和单一的内存地址空间，将系统和HBM GPU内存结合在一起，简化了可编程性。

“Grace平台及其Arm CPU是NVIDIA迈出的一大步，” Tirias Research的分析师Kevin Krewell在一封电子邮件中表示。“Grace的亮点在于，使用定制的Arm CPU将有可能扩展大型LPDDR5 DRAM阵列，使其远远大于直接连接到GPU的高带宽内存。”

发新品、涨股价，英伟达帝国雏形尽显

洛斯阿拉莫斯国家实验室将使用Grace CPU

而得益于出色的性能，Grace将被瑞士用于世界上最快的超级计算机——Alps。这台超级计算机将具有 20亿次浮点运算（exaflops） 的AI处理能力。（这指的是可用于人工智能应用的计算量。）

这比当今领先的人工智能超级计算机NVIDIA Seline超级计算机的2.8exaflop高出约 7倍。

Alps将致力于解决从气候、天气到材料科学、天体物理、计算流体动力学、生命科学、分子动力学、量子化学和粒子物理等领域的问题，以及经济和社会科学等领域，并将于2023年上线。

同时，NVIDIA还表示，将使其GPU与亚马逊网络服务（AWS）基于ARM的Graviton2 CPU一起用于云计算的数据中心。

而在新闻发布会上，有人问NVIDIA是否会与英特尔和AMD的x86芯片竞争时。NVIDIA产品管理和营销高级主管 Paresh Kharya 则含糊其辞，“我们没有与x86竞争......我们将继续与x86 CPU合作。”

DPU成新增长点

最后，NVIDIA在GTC 2021上还揭开了BlueField-3数据处理单元（DPU）的神秘面纱，这是一款为AI和分析工作负载而打造的数据中心机器系列中的最新产品。

BlueField-3搭载了软件定义的网络、存储和网络安全加速功能，提供NVIDIA宣称的相当于300个CPU的处理能力，约有 1.5 TOPS （处理器运算能力单位，指每秒钟可进行一万亿次操作）。

根据Statista的数据，截至2019年，大数据分析在企业中的应用率为52.5%，还有38%的企业打算在未来使用该技术。

但其优势显而易见，Enterprenuer.com的2019年调查发现，实施大数据分析的企业利润普遍增长了8%到10%。

NVIDIA的BlueField-3 DPU拥有 220亿个晶体管 ，采用300GbE/NDR互连，可以提供比上一代BlueField-2 DPU高 10倍 的计算量。内置的16个ARM A78内核可以管理 4倍的加密性能。

另外，BlueField-3是第一个支持第五代PCIe和时间同步的数据中心加速的DPU。

发新品、涨股价，英伟达帝国雏形尽显

BlueField-3 DPU

此外，BlueField-3还可以充当Morpheus 的监控代理，这是NVIDIA当天发布的支持AI的云网络安全平台。

此外，它还利用了DOCA（片上数据中心架构）的优势，用于构建运行在BlueField DPU上的软件定义、硬件加速的网络、存储、安全和管理应用。

BlueField-3预计将在2022年第一季度小规模上市。NVIDIA表示，它与BlueField-2完全向后兼容。

“现代超大规模云正在推动数据中心的基本架构革新，” 黄仁勋表示。“需要一种旨在处理数据中心基础设施软件的新型处理器，以卸载和加速虚拟化、网络、存储、安全和其他云原生AI服务的巨大计算负载。BlueField DPU的时代已经到来。”

发新品、涨股价，英伟达帝国雏形尽显

NVIDIA的DPU路线图

而NVIDIA的数据中心业务，包括其DPU部门，正迅速成为该公司的主要收入驱动力。2月份，它公布了创纪录的19亿美元季度收入，比去年同期增长97%。 全年数据中心收入猛增124%，达到67亿美元。

结语

当然，以上也不是GTC的全貌，例如NVIDIA还推出了一款旨在帮助企业选择、适应和部署机器学习模型的新产品—— TAO 。

TAO集成了NVIDIA的迁移学习工具包（Transfer Learning Toolkit），以利用小型数据集使模型具有定制化的适应性，而不需要花费成本、时间和大量的语料库来从零开始建立和训练模型。

发新品、涨股价，英伟达帝国雏形尽显

NVIDIA声称，TAO已经在仓库、零售业、医院和工厂车间得到使用。用户包括埃森哲、宝马和西门子等公司。

根据Gartner的数据，从2015年到2019年，企业对人工智能的使用增长了270%，而德勤表示，其2018年10月的企业报告中，62%的受访者部署了某种形式的人工智能，高于一年前的53%。 在这种增长的推动下，Grand View Research预测，到2027年，全球AI市场规模将达到7,337亿美元。

“人工智能是我们这个时代最强大的新技术，但它直到现在一直是许多企业难以驾驭的力量。许多公司缺乏深度学习所需的专业技能、访问大型数据集或加速计算的能力。”NVIDIA NGC产品管理总监Adel El Hallak在一篇博客文章中写道。

不过，对于NVIDIA来说则是另外一番景象了，其已具备最全面、最强大的计算解决方案，恰如黄仁勋所说， “CPU、GPU和DPU，NVIDIA已经三箭在手。”