英伟达gb200 (英伟达gb200华为)

Q:能否解释一下“铜进光退”现象以及它对光模块市场的影响?

A: “铜进光退”现象是指在某些数据中心或网络架构中,铜缆的使用量增加而光模块的使用量相对减少。这种现象可能会对光模块市场产生影响,因为它可能导致市场对光模块的需求下降。然而,根据我们的详细测算和评估,我们发现实际上并没有出现光模块配比的下降,相反,光模块的配比是在上升的。特别是在从hpop系列到black2系列,以及从GH200到GB200的产品升级过程中,光模块的边际增量非常明显。这表明,尽管市场存在一些误解和分歧,但从长远来看,光模块市场仍然具有增长潜力。

Q: GB200发布后市场出现了哪些变化?

A:自从GB200发布以来,市场对于支持NVLink72链路的机柜的需求有所增加。这些机柜内部配置了多台交换机,每台交换机都配备了多个NVswitch芯片,而且柜内全部使用铜缆连接IB。这种配置的变化导致了市场对于铜缆和光模块使用量的重新评估。以前的分析可能基于错误的假设,即光模块的使用量会因为铜缆的增加而减少。但实际上,GB200的销量如果符合市场预期,光模块的需求将会比以前的产品更强。

Q:为什么之前的分析逻辑可能是错误的?

A:之前的分析逻辑可能错误地假设了全铜的柜子意味着光模块的使用量会减少。这种逻辑忽略了机柜内部的具体配置和需求。例如,GB200机柜内部的交换机配置和NVLink72链路的支持实际上增加了对光模块的需求。此外,之前的分析可能没有考虑到产品升级换代带来的边际增量,以及不同产品之间的配置参数差异。因此,正确的比较应该是基于相同维度的配置,而不是简单地根据铜缆的使用量来判断光模块的需求。

Q:能否详细解释一下GB200机柜的配置和它对光模块需求的影响?

A: GB200机柜的配置是针对单个机柜的,它内部包含9台交换机,每台交换机有18个NVswitch芯片,每个交换机内有两个这样的配置。这种配置意味着机柜内部需要大量的高速连接,而这些连接往往需要使用光模块来实现。因此,尽管机柜外部使用铜缆连接,但内部对于光模块的需求实际上是增加的。这种配置的变化表明,对于高性能计算和大数据中心来说,光模块仍然是关键的组件之一。

Q:在比较GB200和GH200时,应该注意哪些问题?

A:在比较GB200和GH200时,应该注意到两者的配置参数是基于不同层面的。GB200的配置是针对单个机柜的,而GH200的对比是基于整个集群的配置。如果单纯从算力上看,两者可能相仿,但是节点数量和配置的差异会导致对光模块和交换机的需求有很大不同。因此,合理的比较应该是基于相同维度的配置,就像比较新房子和老房子使用的材料一样,这样才能得出准确的结论。

Q:为什么说GB200的销量乐观将导致光模块需求的增加?

A: GB200的销量乐观意味着市场对于高性能计算和大数据中心的需求正在增长。这些应用场景对于高速数据传输有着严格的要求,而光模块正是实现这些高速连接的关键技术。因此,如果GB200的销量达到预期,那么对于支持这些高速连接的光模块的需求自然会随之增加。这也意味着,市场上对于光模块的担忧可能是基于错误的假设和分析,而实际情况可能远比预期的要好。

Q:如何正确比较GB200和GH200的光模块使用情况?

A:为了准确地比较GB200和GH200的光模块使用情况,我们应该采用集群对集群的比较方式。这是因为光模块的使用与GPU数量并不是简单的线性关系。市场常常存在一个误区,即认为光模块与GPU的比例是1比3,但实际上这个比例可能高达1比9。这种关系是累进的:随着GPU或交换节点数量的增加,对非阻塞全互联网络的需求也随之增加,光模块的需求呈现出指数性增长。相反,当节点数量较少时,光模块的需求可能接近于零。因此,正确的比较方法是在同一集群层面上进行,而不是将单一机柜与整个集群相比较。这是解决误解的关键。

Q:英伟达推出GB200和GH200的原因是什么?

A:英伟达推出GB200和GH200的目的是为了构建无阻塞全互联的集群。这种设计使得所有的GPU能够像一个单一的、庞大的GPU一样工作,无论是之前的256个GPU的大集群,还是现在由576个B200 GPU组成的机柜集群。这种设计就好比一个巨大的DPU(数据处理单元),能够提供极高的计算性能。无阻塞全互联的定义是,集群中的每个GPU都能达到每个链接的理论最高带宽和传输速度,没有任何一个GPU的传输速度受到限制。

Q: GB200机柜是如何实现无阻塞全互联的?

A: GB200机柜通过包含2个B200 GPU,每个B200 GPU带有18个第五代NVLink链接来实现无阻塞全互联。这些链接的双向带宽从每秒50GB升级到了100GB,总共有1296个链接。机柜内部包含9台NVLink*四代第**的交换机,每个交换机有72个NVLink端口。这样的配置使得机柜内的GPU之间可以完全匹配,实现单机柜内的无阻塞全互联,就像72个GPU是一个整体一样。

Q:如果要构建更大的集群,GB200的机柜互联会遇到什么问题?

A:如果要构建更大的集群,比如使用8个GB200机柜构建576个GPU的集群,就需要高性能的光模块来实现这些机柜之间的无阻塞全互联。在这种情况下,我们应该比较GB200的576个GPU集群与GH200的256个GPU集群,而不是单独的机柜与GH200的16个机柜集群。因为GB200的节点数量较少,光模块的需求自然也会较少。这种比较不仅不公平,也没有实际意义。

Q: GB200的机柜互联应该如何实现?

A:对于GB200的机柜互联,有人提出使用InfiniBand(IB)或以太网交换机。然而,我们需要考虑为什么GH200的机柜互联没有采用IB而是使用了A-Link。我们可以将数据包比作汽车,网络比作马路。如果只有少数通道连接机柜,即使内部流量顺畅,互联之间的狭窄点也会成为集群通信的瓶颈。因此,为了提高效率,需要拓宽连接到其他地区的通道。这也是GH200机柜之间采用NVLink交换互联的原因。只有这样,256个GPU或者16个机柜才能像一个整体一样运作。

Q:光模块在GB200和GH200集群中扮演什么角色?

A:光模块在GB200和GH200集群中扮演着至关重要的角色。它们是实现无阻塞全互联的关键组件,确保每个GPU之间的高速数据传输。随着集群规模的扩大,对光模块的性能要求也随之提高。光模块不仅需要支持更高的带宽,还需要保证在大规模集群中的稳定运行。因此,光模块的技术进步和创新对于满足未来数据中心和高性能计算的需求至关重要。

Q:在GB200的8个机架配置中,光互连的需求是怎样的?

A:在GB200的8个机架配置中,由于涉及到576个GPU,必然会用到第二层的光互连。这一点可以从宣传视频中得到证实,视频中展示了除了放置服务器的8个机架之外,旁边还有许多柜子,这些柜子很可能就是用于放置第二层交换机的。目前网络上还没有这种网络拓扑图的公开资料,所以容易引起误解。实际上,这种配置对光模块的需求是非常大的,因为需要在各个机架之间实现高速的数据传输。

Q:如何估算GB200所需的第二层交换机数量和光模块配置?

A:估算GB200所需的第二层交换机数量和光模块配置可以参考GAH200的情况。GAH200的集群由256个GPU组成,每个GPU连接18个NVLink,单个NVLink的双向带宽为50GB/s。为了保证这些链接都能得到有效的配对,在第二层交换机上,每台交换机需要有128个链接。这样,4608个链接除以每台交换机的128个端口,正好是36台。而每个交换机端口的带宽是800G,也就是4个NVLink的总带宽,所以交换机需要配置32个800G的光模块。转移至GB200的情况,576个GPU,每个GPU依然是18个NVLink,但单个NVLink的双向带宽翻倍。所以576个GPU构成的大型集群会有10368个NVLink。第二层的交换机每台可容纳144个端口,所以需要72台交换机才能做到全互联。现在每个端口对应的是四个NVLink,而NVLink的带宽已经提升到1.6T。因此,整个系统中每台交换机必须配备36个1.6T的光模块,最终得出的光模块与GPU的配比是1比9,与GH200相同。

Q: GB200的市场表现与GH200有何不同,光模块的销售增长在哪里?

A:如果说GH200的市场表现不佳,现在GB200的市场表现出色,光模块的销售增长主要体现在两个方面。首先,1比9的配比方案在GH200时代并未广泛采用,但现在随着GB200的出售,这种配比的需求将明显提升。其次,光模块的速率也提高到了1.6T,不仅数量增加,而且单价也提高,这可能还会带来利润率的提升。因此,目前来看,GB200之后的弹性可能是最大的方向。但是由于网上的一些误解,许多人低估了这一部分的预期,认为可能会受损,这是一个重大的误解。

Q:具体测算光模块需求的方法是什么?

A:具体的测算方法是通过手工计算,然后将其整理成PPT和文稿,以便与各位领导进一步沟通。这个过程需要详细分析GB200的配置和需求,以及与GH200的对比,从而得出准确的光模块需求预测。

Q: GB200的预售情况如何,客户购买行为有什么特点?

A:根据不同渠道反馈的情况,GB200的预售情况实际上是不错的。而且,

大多数购买者不只是购买一个机柜,很少会有只买单柜的客户。即使算力

需求不大,购买单柜也需要配套的数据中心和网络环境,这种客户实际上

是很少的。通常,需要大量计算力的大型工厂会购买带有互联功能的版

本,这就意味着光模块的需求会大幅增加。每增加一个节点,光模块的需

求就会相应提高,前提是网络接近无损全互联的配置。因此,光模块的使

用比会有显著不同。与GH200相比,GB200的销售提升将更为明显,光模

块的边际增长将会显著。

Q:在GB200光模块畅销的背景下,光模块相对于铜缆的增长潜力如何?

A:在当前的市场环境下,随着GB200光模块的畅销,我们认为光模块相对

于铜缆的增长潜力可能会更大。这一趋势主要得益于光模块本身所具备的

更高带宽能力,例如从800G提升到了1.6T。随着带宽的提高,对信号传输

的衰减和电磁干扰的要求也随之增加。特别是在GB200的第二层交换机

中,由于连接距离可能超过1米甚至2.3米,从铜缆切换到光缆成为一种必

要。因此,光模块在构建无损光网络和提升性能方面的作用日益凸显,其

市场比重和需求也必然会不断增加。

Q: GB200第二层交换机提供了哪些可选方案,对光模块市场有何影响?

A: GB200第二层交换机提供了三种可选方案:passive copper(无源铜

缆)、active copper(主动铜缆)以及光缆。随着带宽的不断提高,目标

是构建无损光网络并提升性能,光模块的比重必然会不断增加。这三种方

案各有优势,但光缆因其高带宽和低衰减的特性,在高性能计算和大数据

中心的应用中占据重要地位。这一趋势预示着光模块市场的增长潜力巨

大,特别是在GB200等高性能计算平台上。

Q:光模块在数据中心的价值份额是否有所提升?

A:是的,光模块在数据中心的价值份额应该得到提升。尽管去年专家们指

出光模块在数据中心资本支出中只占少数份额,但考虑到AI领域的投资增

加,我们认为光模块的价值份额将会得到提升。如果光模块的价值份额没

有提升,那么去年北美资本开支的显著变化和光模块公司的单季度大变化

就无从解释。光模块的价值份额提升,以及在网络上的占比提升,从而带

来了超越行业增速的超额收益。

Q:光模块在通用数据中心的份额有何变化?

A:以往在通用数据中心,光模块份额可能仅占一两个百分点。然而,随着

技术的发展和市场需求的增长,我们认为超过十个百分点的占比也是可能

的。即便在整个集群中占比超过十个百分点,光模块仍然属于成本较低的

项,但它能显著提升GPU集群的性能。因此,在节省成本时,应该优先考

虑CPU和服务器的开支,而非那些关键性和成本占比不高的光模块。

Q:市场对光模块的误解是否已经得到纠正?

A:尽管市场之前存在一些误解导致回撤,但我们认为某些股票目前是有价

值的。结合上周北美光通信展(VIC),我们预计二代交换机所用的光互

联可能将开始适配新型光模块,例如LPO、LRO或硅光方案。公司如新

兴、旭创等已有相应准备。同时,考虑到功耗问题,如果机柜内部采用光

模块,必须重视功耗管理。因此,市场的误解正在逐步得到纠正,投资者

和行业观察者开始重新评估光模块的市场价值和增长潜力。

Q:我们应该关注哪些核心光模块公司?

A:我们建议关注三家核心光模块公司:旭创、新易盛、天孚。这些公司在

光模块领域的发展速度最快,LPO出货量在新型需求下增长,CPU领域也

在进行B类测试。因此,从研发、产能、成本各方面考虑,头部公司的优

势非常明显。我们建议密切关注这三家核心公司,同时也需注意LPO、

LRO和硅光等新光模块方面的发展。

Q5:光模块市场的新动态有哪些?

A:光模块市场的新动态包括技术的快速进步、新产品的推出以及市场需求

的增长。特别是随着GB200等高性能计算平台的推广,对高带宽光模块的

需求显著增加。此外,新

型光模块如LPO、LRO和硅光方案的推出,预示着光模块市场将迎来新一

轮的增长。同时,随着技术的发布和落地,功耗和成本的优化变得极为关

键。网络协议层面的变化也值得关注,这可能会导致整体生态结构的变化

。供应链管理的安全性和可靠性的重视也是一个不容忽视的趋势。

Q:光模块配比在GB200升级过程中有何变化?

A:在GB200升级过程中,光模块恰恰是最大的增量所在,并且配比没有下

降,反而会进一步提升。这一切建立在算力需求持续大幅增长、模型规模

持续大幅提升的基础上,而且GB200的销量可能超出预期。因此,光模块

的市场需求和价值份额都有望得到显著提升。

Q:新技术对光模块市场的影响如何?

A:新技术对光模块市场的影响是显著的。随着技术的发布和落地,尤其是

新型光模块如LPO、LRO和硅光方案的推出,光模块的性能和应用范围将

进一步扩展。这些新技术不仅能够提供更高的带宽和更低的功耗,还能够

优化成本和提高网络的整体性能。因此,新技术的落地将为光模块市场带

来新的增长机遇和挑战。

Q:网络协议层面的变化对光模块市场有何影响?

A:网络协议层面的变化可能会导致整体生态结构的变化,这对光模块市场

有着深远的影响。随着新的网络协议和标准的推出,光模块的设计和生产

可能需要进行相应的调整,以满足新的性能要求和兼容性需求。同时,网

络协议的变化也可能带来新的市场机遇,推动光模块技术的创新和应用。

Q:供应链管理的安全性和可靠性为何重要?

A:供应链管理的安全性和可靠性对于光模块市场至关重要。随着市场需求

的增长和技术的不断进步,光模块的生产和供应变得越来越复杂。确保供

应链的安全性和可靠性可以保障产品质量,满足客户需求,同时也能够降

低运营风险,提高企业的竞争力。因此,供应链管理的安全性和可靠性是

光模块制造商和供应商必须重视的关键因素。

Q:以太网架构升级对光模块和网络设备的影响是什么?

A:随着AI无线网络的需求增长,传统网络解决方案需要进行以太网的

IDMA升级或超以太网升级。这种架构的升级对光模块、交换机和网络侧的

影响主要体现在技术要求和市场需求的提升。光模块需要支持更高的数据

传输速率和更大的带宽,以满足AI应用对高速网络的需求。同时,交换机

和网络设备也需要更新以支持更高效的数据交换和处理。这些变化可能导

致下游客户变得更加分散,因为AI应用场景的多样化催生了更多的新兴AI

公司和集群公司,从而为光模块和网络设备制造商提供了更广阔的市场。

Q:集中采购对光模块行业的影响有哪些?

A:如果市场上大部分客户都集中购买某一解决方案,如NVIDIA的

Superpod,这可能导致光模块的下游客户过于集中,理论上只有NVIDIA

一家。这种集中采购可能会减弱光模块制造商的议价能力,影响其盈利状

况,使得市场竞争更加激烈。然而,如果采购权回归给更多的制造商,这

将有助于分散市场,增加新兴AI公司和集群公司的市场份额,从而可能提

升中*行游**业在利益和定价权上的地位。

Q:采购权回归制造商对光模块市场份额有何影响?

A:采购权回归制造商可能会导致光模块市场份额的重新分配。例如,亚马

逊可能更倾向于与Inphi和Luxtera合作,而Meta之前可能更偏向于Intel等公

司。现在,随着采购权的回归,中国厂商如Lumentum、新英讯等的市场

份额可能会有所上升。这种变化为各个光模块和交换机供应商提供了市场

份额提升的机会,也可能引起市场格局的变动。

Q:当前光模块行业的估值情况如何?

A:结合四月份的生产制造情况以及之前市场的回调,当前光模块行业的估

值非常有性价比。这意味着投资者可能会发现光模块行业的股票价格相对

较低,但考虑到行业的增长潜力和技术进步,这些股票可能具有较高的投

资价值。

Q:未来光模块业务的发展趋势是什么?

A:展望未来,如果GB200的表现大幅超出预期,光模块的业务弹性有可能

超过服务器、交换机、PCB等多个方向。这是因为集群需求的不断增长需

要进行升级和扩容,特别是在AI和高性能计算领域。随着技术的进步和市

场需求的扩大,光模块行业有望迎来新一轮的增长期。

英伟达gb200算法,英伟达gb200国内合作