GPU芯片国内外头部企业 (gpu芯片龙头企业排名前十)

（一）

姓名：黄仁勋

（Jensen Huang）

国别：美籍华人，祖籍浙江

主要履历：

于1963年2月17在中国台湾省台北市出生，1972年与家人迁往美国，后来被送往美国肯塔基州一间基督教学校就读，完成课程后迁往俄勒冈州。15岁时参加美国乒乓球公开赛，在青年组双打赛事中夺得季军。

1984年于俄勒冈州立大学取得电气工程学位，其后在斯坦福大学取得硕士学位。

黄仁勋曾在AMD（1983年-1985年）担任一名芯片设计师，这为他后来创办NVIDIA打下了最初的技术基础。

LSI Logic（1985年-1993年）工作，这也是一家芯片公司，但主打业务并不是CPU，而比较倾向于芯片的图形处理。他在设计部门待了两年后就要求调到销售部门，并最终成为集成芯片（类似于今天的SOC，即一块芯片上集成多重功能）部门的总经理。

1993年创立NVIDIA（全球最大显卡芯片厂商）。黄仁勋是圈子里有名的工作狂，他曾经解释自己为何如此狂热：为了我们的孩子们，让他们的将来更好一些。

当前工作机构和职务：

NVIDIA公司创始人兼首席执行官，硅谷最具影响力的华人企业家被业内称为“AI教父”。

代表性成果：

提出了和摩尔定律并称的显卡芯片领域的“黄氏定律”，即显卡芯片每6个月性能提升一倍。

1997年，推出了NV3（N1和N2都失败了），即Riva 128，并大胆采用当时仍处于试验阶段的AGP概念。这是全球第一款具有3D加速能力的AGP显卡，一经推出后，随即引发市场关注。Riva 128上市四个月销量就达100万片。紧接着，黄仁勋又推出简单升级版Riva 128zx，也就是我们熟知的小影霸。

1998年10月，推出了NVIDIA*四代第**产品——*NTT**，从此一举占据了显卡芯片市场的主流位置，把所有的竞争对手都挤到边缘领域。*NTT**是一种*药炸**的名字，而黄仁勋的*NTT**也果如其名，成为图形芯片行业的一枚重磅*药炸**，响彻云霄，被称为超级显卡，性能比3dfx同期推出的Voodoo2强很多。

半年后，还没等3dfx回过神来，黄仁勋又带领NVIDIA推出更强大的*NTT**2，性能再次秒杀Voodoo系列，彻底奠定了NVIDIA的高端地位。

推出全新架构的显示芯片——GeForce256，作为全球首款GPU，GeForce 256的出现改变了传统图形芯片的格局，率先将显示芯片业带入GPU时代。

经过20+年发展，NVIDIA逐渐形成GeForce、Quadro、Tesla、Tegra等几大产品线；

其中GeForce用于传统PC；Tegra用于移动产品；

Quadro用于工作站；

Tesla用于大型计算。

（二）

王启尚（David Wang）

国别：台裔美国人

gpu十大优质芯片股,国内顶尖gpu工程师

主要履历：

王启尚1986年毕业于台湾交通大学，后留美在华盛顿大学取得了电子工程硕士学位，硕士论文是有关图形处理的硬件技术。

1990年毕业后来到了LSI Logic任职芯片设计工程师，负责开发SPARC(可扩充处理器架构)系统芯片，在此期间掌握了丰富的芯片开发经验。

2012年，他被评为台湾交通大学杰出校友。

两年后入职Axil WorkstATIons公司，担任高级芯片设计工程师，职务内容同样是开发SPARC芯片，并且有了自己的团队。

出于对芯片发展趋势的独到把握，1993年，王启尚正式入职大名鼎鼎的SGI(Silicon Graphics)公司，从芯片设计人员转型为芯片设计经理，负责Infinity Reality超级3D图形加速器的开发工作。

王启尚1998年离开SGI，并参与建立ArtX公司，继续担任芯片设计经理的职务，负责任天堂*四代第**家用机Game Cube的SOC的开发工作。

2000年，ATI公司以价值4亿美元的股票选择权正式收购ArtX公司，王启尚也加入ATI公司，这一干就是12年，从芯片经理升职为高级经理（2006年AMD以54亿美元并购ATI后，王启尚也一同加入了AMD），最后成为AMD公司的全球副总裁。

在他的领导下，AMD/ATI成功地开发了八代的产品，从0.15μm一直到28nm的制程，其在整个研发过程中起到了不可或缺的作用。

当前工作机构和职务：

AMD Radeon 技术事业部工程研发高级副总裁；

负责 AMD Radeon 技术事业部的工程研发。

他的职责范围涵盖 AMD 显卡工程研发的方方面面，包括 AMD 显卡产品和技术的战略、架构、硬件和软件。

代表性成果：

帮助ATI成长为行业领头羊，ATI的R300架构正式问世，首发产品为全球首块支持DirectX 9.0的显卡——Radeon 9700 PRO。

王启尚在R300的架构设计工作中起到了至关重要的作用。

从Radeon X1000到Radeon HD 7000系列的每一款AMD GPU的研发工作均凝聚着他的汗水，他用丰富的经验引领AMD的GPU走向GCN时代。

作为AMD公司图形卡产品部高级总监，其不仅参与设计了R600这样出色的架构，还是超微公司AMD“Fusion”概念的提出人之一，也就是说将CPU和GPU合二为一，让具备不同特性的两种芯片相互协作，而这正是AMD APU的概念雏形。

作为AMD全球绘图产品事业部硅体工程部副总裁时，主导研发了Radeon HD 5000系列。

除了桌面及笔记本级的GPU产品，王启尚还参与了Wii U、PS4、XBOX ONE等次世代主机定制化GPU的开发，还有前面提到的AMD“融聚未来”的APU的开发工作。

成功推进了从0.15μm一直到28nm八代芯片的工艺转换。

在AMD(ATI)众多GPU产品的研发中起到了不可替代的领导作用，尤其是RDNA系列GPU架构，以超高能效而闻名。

Chiplet架构，一条正确的道路

从CPU到GPU，Chiplet技术让AMD窥到了些许未来芯片发展道路的曙光，显然AMD还准备一直坚持走下去。从RDNA 3架构产品目前表现出来的性能来看，Chiplet或许真的是一条正确的道路。

王启尚介绍道：“Chiplet架构让我们能够选择用更正确的制程工艺去完成适当的工作，比如我们把比较昂贵的5nm用在计算核心引擎当中，这样就可以实现非常出色的每瓦性能，然后我们用比较成熟的6nm制程来打造I/O和我们的Infinity Cache高速缓存，我们可以说Chiplet设计可以为每种价位上的产品实现更强的性能。”在我们看来，这也是从Chiplet架构上来看，这一设计最大的优势所在。

（三）

姓名：Joshua Friedrich

（约书亚·费德里奇）

国别：美国

主要履历：

1995年—1999年，在美国德克萨斯大学奥斯汀分校获得电气与电子工程学士学位。

1999年—2019年12月，一直在 IBM 的 Power 服务器处理器领域上工作了 20 多年，担任Power处理器技术总监。

2020年1月，入职AMD，在从 IBM 离职前，Joshua 仍在开发未来的 POWER 设计。

在加盟 AMD 之后，他负责 CPU / GPU 集成技术。

换言之，Joshua 可以将丰富的经验注入 APU 或其它独特的产品，在平台 / 解决方案上创造出更具差异化的产品。

当前工作工作机构和职务：

目前担任AMD公司副总裁，主要负责推动 AMD 集成 CPU 和 GPU 技术方法

代表性成果：

主导开发了当前TOP500第一超算Summit使用的处理器Power9（POWER9 的概念 / 高级设计和非核心方面的开发工作）

负责过 POWER5 的时钟门控

POWER6 的频率引线

POWER7 的芯片电源引线

POWER8 芯片电路

（四）

姓名：Mark Papermaster

（马克·帕佩马斯特）

国别：美国

主要履历：

Papermaster拥有奥斯汀德克萨斯州大学电机工程学士学位，以及佛蒙特大学电机工程硕士学位。他目前是德克萨斯州大学科克雷尔工程学院咨询委员会成员以及青少年糖尿病研究基金会IT咨询委员会委员。

1982年9月—2008年10月（26年2个月），曾担任多个高级领导职务（包括副总裁），加入公司的技术领导团队并主管公司重要微处理器和刀片服务器技术的研发工作，领导了 IBM 企业级和 HPC 系统中使用的多代 System z 和 Power 处理器的开发。

2008年11月—2010年8月（1年10个月），Papermaster 在苹果公司担任设备硬件工程部高级副总裁，负责研发苹果的处理器和系统级芯片。

2010年11月—2011年10月（1年），就职于思科公司，担任硅工程副总裁，带领团队负责公司交换与路由业务中的硅技术战略、体系结构和开发等事务。

2011年10月—2019年1月（7年4个月），担任首席技术官兼技术与工程高级副总裁。

当前工作工作机构和职务：

2019年1月—至今，担任AMD公司的首席技术官和技术与工程执行副总裁。负责公司的技术方向和产品开发，包括微处理器设计、I/O和内存、系统级芯片(SOC)方*论法**，以及高级技术研究。

代表性成果：

领导团队重新设计了 AMD 的工程研发流程；

将异构计算、chiplets设计、模块化设计方法 Infinity Fabric融入到新的处理器设计当中；

成功开发出广受赞誉的 “Zen”架构高性能 x86 CPU 系列产品、高性能GPU。

Zen 3架构的主导者。

（五）

姓名：Chris Malachowsky（克里斯·马拉科夫斯基）

国别：美国

gpu十大优质芯片股,国内顶尖gpu工程师

主要履历：

出生于 1958 年，1983 年毕业于佛罗里达大学电气工程专业；1986 年获得圣克拉拉大学硕士学位。

两家高校均为 Malachowsky 颁发了杰出校友奖。他是集成电路设计和方法学领域的公认权威，已获得 25项美国专利。

Chris 职业生涯早期，曾在惠普和 Sun Microsystems（太阳计算机系统，已于2009 年被甲骨文收购）工作，担任工程和技术领导职务。

gpu十大优质芯片股,国内顶尖gpu工程师

1993 年参与创办了 NVIDIA（同为创办人的还有普雷艾姆，当时他是首席技术官，推出了N1和N2，但是效果都不理想，后来被CEO换下来了），拥有 30 余年的行业经验。他是高管团队的成员之一，也是公司的技术高管。

当前工作机构和职务：

联合创始人兼高级副总裁兼NVIDIA院士

代表性成果：

发明了图形处理单元（GPU），通过创建面向消费者的 3D 图形市场改变了视觉计算行业。

作为集成电路设计和方法学方面公认的权威，Malachowsky 的工作推动了全球计算机图形行业的发展。

拥有35项美国专利。

2020年7 月 21 日，佛罗里达大学宣布，与英伟达建立公私合作伙伴关系，为学生、教职员工和研究人员提供最强大的 AI 训练和工具，打造全球高校最快 AI 超级计算机。

幕后金主，正是英伟达联合创始人、佛罗里达大学校友 Chris Malachowsky。

gpu十大优质芯片股,国内顶尖gpu工程师

佛罗里达大学表示，此举将增强学校的研究实力，以应对世界上一些最严峻的挑战，为弱势群体创造前所未有的人工智能培训和工具，并为改变劳动力的未来提供动力。

投 7000 万美金，力求高校最快 AI 超算

此次合作，佛罗里达大学共获得了 7000 万美元的投资。

其中，Chris Malachowsky捐赠的 2500 万美元；

以及英伟达捐赠的 2500 万美元的硬件、软件、培训和服务；

另外还有校方 2000 万美元的投资。

佛罗里达大学将用这些资金，创建一个以 AI 为中心的数据中心，力争成为全球高等教育院校中，速度最快的 AI 超级计算机。

佛罗里达大学也自此成为美国第一所采用 DGX A100 的高等院校。

此外，校方还承诺，将雇用 100 名专注于人工智能的教职员工，他们将把 AI 融入教学和研究中。

此次三方联手斥巨资打造的第三代 HiPerGator，将使用英伟达最先进的 AI 软件；并将 140 个英伟达 DGX A100 系统与 1120 个英伟达 A100 Tensor Core GPU 和高性能英伟达 Mellanox HDR 200Gb / s InfiniBand 网络集成在一起。

可提供 700 petaFLOPS 的 AI 性能。

如此高性能的 HiperGator，将为佛罗里达大学校内外的教职员工提供可用于各个领域的 AI 工具，这些领域包括但不限于海平面上升、人口老龄化、数据安全、个性化医疗、城市交通和粮食不安全等。

这些年来，英伟达从一家初创公司成长为视觉和并行计算领域的全球领导者，Chris 功不可没。

他在管理、定义和推动公司核心技术方面，发挥了重要作用。

作为英伟达高管，他领导了许多职能，包括 IT，运营和公司产品工程的各个方面。最近，他负责英伟达的一个研究机构，该组织负责开发战略技术，以帮助推动公司的未来发展和成功。

除了他的技术成就外，他还很有艺术细胞。

2009 年，他凭借自己协助制作的影片《Inheritance》（《继承》）获得了艾美奖，该影片还获得 2009 年最佳纪录片奖。

如今，65岁的 Chris 事业有成，但不忘母校昔日培养之恩，大方回报母校，不愧为杰出校友。

（六）

姓名： Bill Dally

国别：美国

gpu十大优质芯片股,国内顶尖gpu工程师

主要履历：

Bill Dally获得弗吉尼亚理工大学电气工程学士学位、斯坦福大学电气工程硕士学位和加州理工大学计算机科学博士学位。

他是Velio Communications和流处理器的联合创始人。

曾于1986年至1997年在麻省理工学院工作。

在那里他和他的团队建造了J-Machine和M-Machine，这是一个实验性并行计算机系统，开创了将机制与编程模型分离的先河，并展示了非常低的开销同步和通信机制。

1983年至1986年，他在加州理工学院（CalTech）工作，设计了MOSIM模拟引擎和Torus路由芯片，开创了“虫洞”路由和虚拟通道流量控制的先河。

他是美国国家工程院院士、美国艺术与科学院院士、IEEE和ACM院士，并获得ACM Eckert Mauchly奖、IEEE Seymour Cray奖和ACM Maurice Wilkes奖。

他发表了200多篇论文，拥有75多项专利，著有2本教科书。

gpu十大优质芯片股,国内顶尖gpu工程师

Dally于2009年加入英伟达，此前他担任斯坦福大学计算机科学系主任，致力于数据科学、人工智能和图形学的研究，拥有120多项专利。

当前工作机构和职务：

美国国家工程院院士、美国英伟达（NVIDIA）公司全球副总裁、首席科学家

代表性成果：

发表了200多篇论文，拥有75项专利，著有2本教科书。

Dally和他的斯坦福团队开发了当今大多数大型并行计算机中的系统架构、网络架构、信令、路由和同步技术。

在麻省理工学院工作时，和他的团队建造了J-Machine和M-Machine。

设计了MOSIM模拟引擎和Torus路由芯片。

流处理器：Dally是流处理器的创始人之一，并在该领域的研究方面取得了巨大成就。流处理器是一种特殊的计算机处理器，用于高效处理大量数据。

网络设计：Dally在网络设计方面也取得了巨大成就，特别是在计算机网络设计方面。

他设计了许多用于高效数据传输的网络架构，包括：数据中心、云计算和移动计算等应用。

超级计算机系统：Dally还在超级计算机系统方面取得了巨大成就。他设计了许多用于超级计算机的硬件和软件系统，并对其进行了优化。

英伟达首席科学家Bill Dally在一年一度的中国GPU技术大会召开前表示，GPU让人工智能（AI）的性能每年都能成倍提升，英伟达的研究人员正在定义如何在具有更高带宽、更易于编程的系统中制造更快AI芯片的方法。

利用GPU的加速处理技术，AI正在医疗、自动驾驶汽车和机器人等多个行业的特定领域平台发挥巨大作用。

英伟达也在不断进行基础研究的投入，以寻求芯片物理极限的突破，让AI的性能得到进一步的提升。

“我们的平台正在以光速发展，（GPU）每10年的速度就能增加1000倍。技术的提升离不开基础研究的投入。”

Dally认为，要让芯片技术突破物理极限，就必须进行架构上的改进。

gpu十大优质芯片股,国内顶尖gpu工程师

Dally于2009年加入英伟达，此前他担任斯坦福大学计算机科学系主任，致力于数据科学、人工智能和图形学的研究，拥有120多项专利。

他目前领导着英伟达一个200多人的科学研究团队。

在2020年的英伟达GTC大会中，Dally计划重点讨论英伟达如何在GPU上实现高效的推理加速器，硅光子学（silicon photonics）和Python编程等项目。

Dally所说的的硅光子学，是一种基于硅片的激光技术，能够更广泛地应用于计算机中，通过采用大规模硅基制造技术，能大幅度降低计算机和数据中心的成本。英特尔和加州大学圣芭芭拉分校对研究人员此前已经成功研发出了世界上首个采用标准硅工艺制造的电力混合硅激光器。

该技术离商品化仍有很长距离，但研究人员相信，未来他们能够将数十个甚至数百个混合硅激光器，与其他硅光子学部件一起被集成到单一硅基芯片上。

目前由GPU支持的超级计算机已被广泛用于药物发现、基因组学以及生物学等领域。

全球速度最快的超级计算机Summit已经能够在12小时内筛选出10亿种潜在药物组合，这在正常的计算机上要花上几个月的时间；基因测序公司牛津纳米孔（Nanopore）能在7小时内对病毒基因组进行测序；美国国立卫生研究院和德克萨斯大学奥斯汀分校使用GPU加速软件，通过低温电子显微镜重建了病毒蛋白的第一个3D结构。

英伟达还通过开发基于GPU的量子模拟器来支持量子计算机的发展。

“我们认为，量子计算机步入实际的商业化应用可能还需要10年至15年时间，英伟达正在密切关注相关领域技术的发展，并会在适当的时机进行投资。”Dally表示。

针对量子计算机的应用前景，Dally认为，最先相关的应用可能是量子化学领域。

“因为它能最直接地映射到架构上。”他说道。但他同时表示，量子计算机本质上来说是一种“大型计算和小型数据的技术”。“它永远无法用来解决大数据的问题。”

目前大规模的搜索和机器学习问题是通过大量的、并行的、专用的GPU来解决的。

根据波士顿咨询（BCG）参考英伟达的业绩预测，到2030年，量子计算取代基于GPU的算法应用规模将超过200亿美元，其中化学、材料科学等科技密集型产业的规模将达70亿美元。

量子计算目前的主要参与者包括IBM、谷歌、DWave，以及英特尔、微软、麻省理工、耶鲁、牛津、加州圣芭芭拉大学等。

英伟达首席科学家 Bill Dally 所描述的“后摩尔定律时代计算机性能如何实现的结构性转变”主要基于人类的聪明才智。

这一特征似乎难以建立一条定律，但 Dally 认为，下面的图表标志着“黄氏定律”的开始。

gpu十大优质芯片股,国内顶尖gpu工程师

“黄氏定律”并非英伟达自己的首创说法。IEEE Spectrum 第一个提出以黄仁勋命名定律，“黄氏定律”后来因《华尔街日报》的一篇专栏而广为人知。

根据 Dally 最近在 Hot Chips 2023 会议上的演讲，上图显示过去十年 GPU AI 推理性能增长了 1000 倍。

Dally 表示，有趣的是，与摩尔定律不同，工艺缩小对黄氏定律的进展几乎没有影响。

Dally 回忆起如何通过改变英伟达 GPU 底层数字处理来实现 16 倍的增长。使用Transformer 引擎的 Nvidia Hopper 架构的到来带来了另一个巨大的推动。

据称，Hopper 使用 8 位和 16 位浮点与整数数学的动态组合，实现了 12.5 倍的性能飞跃，并且节省了能源。

（七）

姓名：Michael Kagan

国别：以色列

gpu十大优质芯片股,国内顶尖gpu工程师

主要履历：

拥有以色列理工学院电气工程理学学士学位

1983 年 8 月—1999 年 4 月，Kagan在英特尔公司担任过多个架构和设计职位。

在英特尔公司工作期间，Kagan 在 1993 年 3 月至 1996 年 6 月期间负责管理奔腾 MMX 设计。

从 1996 年 7 月到 1999 年 4 月，他负责管理 Basic PC 产品组的架构团队。

1999年，Kagan的事业开启了新篇章，他受Eyal Waldman的邀请共同创立了Mellanox。

通过为超级计算机提供超快的通信技术一举将Mellanox打造成世界上最成功的以色列公司之一。

2019年，NVIDIA收购Mellanox（被称为以色列版“华为”，拥有RDMA技术），作为该公司CTO兼联合创始人的Kagan由此加入NVIDIA 并担任首席技术官。

当前工作机构和职务：

NVIDIA首席技术官，负责跨技术架构

代表性成果：

他领导了多个处理器开发团队并且设计了著名的i860XP处理器

奔腾 MMX 设计

Basic PC 产品

身为英伟达公司CTO，Kagan解释了AI计算需求如何推动半导体技术突破摩尔定律的边界。

英伟达正积极拥抱一种新的计算范式，利用大规模并行计算机系统为新一代应用程序提供服务。

而这场变化的开端，主要始于以色列。

NVIDIA CTO Michael Kagan指出：

“虽然计算元件随着发展而尺寸愈小，但21世纪的计算设备本体却向着大小两极延伸——小至智能手表、大至超大规模数据中心。”

“数据中心本身就相当于一台计算机，而英伟达正在建立数据中心架构。我们正在打造几乎一切的必要元素，包括调整芯片、框架乃至应用程序，以便让这台21世纪机器上的一切都高效执行。”

Kagan居住在以色列海法区，三年前经由Mellanox Technologies收购案正式加入英伟达，目前担任公司CTO。

英伟达创始人兼CEO黄仁勋对Kagan寄予厚望，任命他督导一切系统架构事宜。

超越摩尔定律

著名的摩尔定律，源自戈登·摩尔 (Gordon Moore) 1965 年撰写的一篇论文《在集成电路上塞入更多元件》。

这位后来担任英特尔CEO的技术先驱在文中预测，随着技术与经济的双重驱动，未来半导体行业每年都将在同样大小的空间内将晶体管的布置数量翻倍，而且这种情况将持续10年。

他的观察和总结后来被称为摩尔定律，且10年后稍做修改就继续适用。

1975年，摩尔表示发展的速度将变成约每两年翻一番。

他还提到，在可预见的未来，这样的情况将一直持续下去。

直到2005年左右，芯片制造商都始终保持着这样的发展速度，但之后情况开始变化——无论是在经济还是在物理特性上，各晶体管元件间的距离已经太小，每过两年将相同空间内的晶体管数量增加一倍将难以实现。

为此，芯片制造商想出了各种办法来提高算力水平。

其一就是增加核心数量，另一种则是用网络替代容易引发性能瓶颈的共享总线，将不同组件间直接互连以改善多芯片/处理器和内存之间的通信能力。

半导体制造商还发明了其他提升计算能力的新方法，包括研究算法、加速器和新的数据处理方式。

加速器是一类专用组件（通常采取芯片形式），能够以极快速度执行特定任务。一旦系统遇到此类任务，就会将其交由加速器处理，从而实现整体性能提升。

厂商们还特别关注人工智能（AI）。

与计算机行业惯用的冯·诺依曼架构相比，AI用例中的数据处理方式可谓截然不同。

Kagan解释称，“AI基于神经网络，这是一种与冯·诺依曼架构大相径庭的数据处理方式。

冯·诺依曼架构的本质，是一种执行指令、查看结果、再决定下一步做什么的串行机器。”

“而处理数据的神经网络模型则受到人脑研究的启发。向神经网络提供数据，它就会从中学习。其工作原理类似于向三岁的小孩展示狗和猫，最终让对方学会区分这两者。在神经网络的帮助下，我们得以解决众多以往在冯·诺依曼架构上不知该如何处理的问题。”

AI与数字孪生等新型应用也加快了对于计算性能的需求，新需求自然需要搭配新的范式。

以往，软件开发只需要很少算力，主要算力需求都集中在程序的运行过程上。

相比之下，AI则需要大量算力来训练神经网络，但训练完成之后的运行成本却要低得多。

单个GPU或CPU都不足以训练大型AI模型。

例如，ChatGPT的训练就需要使用约1万个GPU。

所有GPU并行工作，彼此之间也自然需要相互通信。除了大规模并行处理之外，新的计算范式还要求使用新型专用芯片，名为数据处理单元（DPU）。

黄氏定律

Kagan谈到，“2003年时，世界上最快的计算机器是Earth-Simulator地球模拟器，性能为每秒万亿次浮点运算。而当今最快的计算机是Frontier，运算速度已经达成百亿亿级别，是当初的100万倍。是的，20年间从万亿级提升到了百亿亿级。”

他补充道，“在1983年至2003年这20年间，计算性能则提高了数千倍。

从数千倍到数百万倍，这种计算性能的飞跃就是很多人说的「黄氏定律」。即我们英伟达CEO黄仁勋观察到的，GPU加速计算性能每隔一年就会翻一番。”

“事实上，算力的增长速度还不止每年倍增。现在我们讨论的是AI工作负载和数据处理的新方法。

如果把目光转向这一代英伟达Hopper GPU上运行的应用程序，就会发现与上代Ampere相比，速度的增幅超过了20倍。”

Kagan表示，这种计算速度的提升主要源自算法和加速器的双重加持：“每推出新一代GPU，都会添加更多、更强的加速器，以及更复杂的数据处理方式。”

“新设计完全取决于如何在不同部件之间划分功能。现在我们面对三大计算要素——GPU、CPU和DPU，外加连通彼此的网络。是的，网络本身也执行一部分计算。在英伟达收购的Mellanox公司，我们引入了网络内计算技术，能够在数据流经网络时执行一部分计算。”

从当初每两年让晶体管数量倍增、从而令计算性能翻一番的摩尔定律，到如今依靠GPU加速计算实现每年翻番的黄氏定律，半导体行业仍在不断突破新的极限。但目前来看，即使是黄氏定律恐怕也跟不上AI应用不断增长的需求。毕竟AI应用已经给出了明确的性能需求：每年算力提升10倍！

（八）

姓名：Rohit Verma

国别：美国

主要履历：

1997年7月—1999年3月，在美国国家半导体，作为设计工程师

1999—2013年期间曾在Intel工作了15年之久，曾担任AMD高级Fellow、独立GPU首席SoC架构师。

2013年投奔AMD，担任半定制业务事业部首席SoC架构师、AMD Fellow，干了4年11个月后担任独立GPU首席SoC架构师，并升为AMD高级Fellow。

当前工作机构和职务：

AMD首席产品架构师，ntel AXG团队。

代表性成果：

在 AMD 的八年+职业生涯中，Verma 参与的项目涵盖台式机和笔记本电脑的独立显卡，以及涉及 CPU、GPU、结构、电源管理和安全性的更广泛的 SoC 架构学科。

（九）

姓名：Raja Koduri

国别：印度

主要履历：

拥有印度安得拉大学的电子和通信学士学位以及印度理工学院Kharagpur的电子和通信硕士学位。他担任屡获殊荣的视觉效果和动画公司Makuta VFX董事会的首席技术顾问。

1996年加盟S3 Graphics；

2001年加入ATI担任先进技术开发总监；

2006年随着ATI被收购进入AMD担任图形首席技术官；

2009 年至 2013 年，Koduri 在 Apple Inc. 担任图形架构总监。

Koduri担任苹果公司的图形架构总监。在任职期间，他帮助为公司的Macintosh产品系列建立了领先的图形子系统，并领导了向Apple的Retina显示屏的过渡。

在他职业生涯的早期，Koduri 曾在 AMD 和 ATI Technologies Inc. 担任过各种图形领导职务，其中包括在硬件和软件方面率先推出 GPU 性能计划、创建 GPU 计算生态系统以及为图形产品功能做出贡献。他最初于 2001 年加入 AMD。

2017 年加入英特尔之前，他是AMD的高级副总裁兼首席架构师，Koduri 领导该集团，全面负责 AMD 加速处理单元（APU）、独立 GPU、半定制和 GPU 计算产品中使用的图形技术。

现任英特尔公司加速计算系统和图形 (AXG) 集团高级副总裁兼总经理。

2022年4月20日，英特尔加速计算系统和图形部门的负责人 Raja Koduri 已被提升为执行副总裁。

当前工作机构和职务：

现任英特尔公司执行副总裁、加速计算系统和图形 (AXG) 集团高级副总裁兼总经理。

代表性成果：

一手创造了Vega图形卡

开发了Polaris、Navi等架构

开启了Xe GPU时代