中金 | AI浪潮之巅系列:东数西算,数据大动脉

2022年“东数西算”工程全面启动,在全国8地全面启动建设国家算力枢纽节点并规划了10个国家数据中心的集群,旨在实现全国算力资源的优化布局。与此同时,我们认为ChatGPT的成功,有望开启新一轮的人工智能投资浪潮,而AI大模型的训练需要更大的算力资源,而更大算力资源需要更多硬件基础设施的同时也会带来更大的功耗。我们认为,初期各厂家主要聚焦在基于AI大模型对于新产品的训练上,而AI训练对于时延不敏感的特性也有助于AI训练算力向西部迁移,推动“东数西算”工程建设落地,并将助力中国通信网络传输能力的大幅提升。

摘要

多家厂商相继布局基于AI大模型应用,东部算力资源缺口或将加大。 2022年全球AI服务器中,头部互联网厂商贡献超70%的需求(TrendForce)。自OpenAI推出ChatGPT以来,百度、三六零、阿里巴巴等厂商均加速布局AI大模型,我们认为有望带动AI算力需求提升。 我们观察到,AI驱动的云端算力需求与算力潜在供给之间存在地区错配, 国内布局AI大模型的厂商多聚集在北上广深及杭州等东部大型城市,但从云端算力潜在供给角度,东部核心城市面临土地指标/能耗指标的限制,进一步扩大算力供给的空间有限。我们认为,AI的蓬勃发展或将导致东部地区IDC算力供给缺口加大。

智算中心与西部资源禀赋匹配,云端算力有望加速向西部迁移。 西部地区能源充足、散热条件良好,叠加土地资源相对丰富,有助于IDC集约化、绿色化发展,并降低电力成本。我们看到,部分东部城市着力推进算力资源统一调度,同时西部6区域积极的“十四五”规划以及近期启动的国家超算互联网工作等政策也为“东数西算”工程渐次落地提供了有力支持。

通信传输能力或成算力迁移核心挑战,西部地区网络运力升级在望。 当前我国电信业务主要集中在东部地区,要打破算力迁移的瓶颈、充分利用西部资源,拓展西部地区的网络运力是核心。目前我国西部地区的 出口带宽 网络时延 水平仍有改善空间,我们预期传输基建、互联网直联点和全光网的建设,有望降低东西部端到端的通信时延。 落实到产业侧,我们建议关注以下积极催化: 1)传输设备: OTN设备向400G高速率迭代,利好龙头光传输设备供应商; 2)光纤光缆: 我们认为光网拓扑结构长期有望进一步优化,G.654.E或将在长途干线中得以加速应用; 3)光模块: 东数西算带来量增需求,DCI等长距离互联场景或将推动相干光模块的放量部署。

风险

AI算法技术及应用落地进展不及预期,数据中心的建设不及预期。

正文

AI大模型推动IDC算力需求提升,东部算力资源缺口或进一步加大

AI大模型参数量持续攀升,推动算力需求快速增长

2022年下半年以来,AIGC(AI-Generated Content,人工智能生成内容)实现了技术和产业应用端的快速发展。初创企业Stability AI于2022年10月发布了开源模型Stable Diffusion,拥有了根据提示词生成文字图片的功能;OpenAI于2022年11月发布了ChatGPT,通过大型语言生成模型提升人机对话的智能化水平。 我们看到,不仅限于初创型企业,包括微软、Google、百度、华为等全球科技企业积极迎接AIGC时代到来。

图表1:ChatGPT相关模型的发展历程

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:OpenAI,北京智源,中金公司研究部

AI大模型的参数量持续提升,看好AI应用落地蓬勃发展。 AI大模型通常包含数十亿至数万亿个参数,需要庞大的数据集进行训练。我们看到,随着AI大模型智能化程序向更高水平迭代,模型参数量及训练数据量也持续增长。以OpenAI GPT版本更迭为例,从GPT(2018.06)到GPT-2(2019.02)、GPT-3(2020.05)、GPT-3.5(2022.11)、GPT-4(2023.03),参数量由GPT的1.17亿提升至GPT-3的1,750亿,预训练数据量持续攀升。 我们认为,随着大模型由文本走向多模态,即结合图像、语音、文本等多种数据类型的学习,AI有望加速落地并赋能百行百业。

图表2:大模型参数量对比

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:北京智源人工智能研究院,中金公司研究部

AI算力需求升级趋势确立。 不同的算法和计算场景有不同的指标来衡量算力,我们通常用并行计算能力(FLOPS,每秒浮点运算次数)来衡量AI领域的算力水平。例如,PC算力是GFLOPS[1]级别;中国超级计算机神威 "太湖之光 "是93PFLOPS;鹏程云脑II(华为Atlas 900集群)是1EFLOPS[2];NVIDIA高性能AI系统DGX H100是16PFLOPS FP16,由32个DGX H100系统组成的DGX SuperPOD集群算力是1EFLOP FP8。通用算力用于计算量小的常规应用,只消耗少量算力;而HPC(高性能计算)和AI(人工智能)则要调用大量的计算资源。 我们认为,跟随AI大模型的蓬勃发展,2023年有望成为AI算力需求升级的重要拐点。

AI大模型的算力需求主要以云端算力的方式承接

AI算力以云端算力需求主导。 基于海量数据训练出的以GPT为代表的大模型,参数持续攀升至千亿量级,对训练的算力投入形成拉动;同时,海量参数也对推理计算量及效率提出挑战,为云端算力需求形成支撑。以Azure与OpenAI的合作为例,微软通过Azure云服务赋能ChatGPT模型计算,本质上是OpenAI借助微软自有的IDC资源,在云端完成计算过程后,获取计算结果。为支持GPT-3的训练,微软向OpenAI单独开发的超级计算系统包括28.5万个CPU核心、1万块GPU芯片,每个GPU服务器的网络连接能力达400Gbps,这个超级计算机是世界上五大公开披露的超级计算机之一[3]。 我们看到,IDC成为承接人工智能计算任务的重要算力基础设施之一。

图表3:GPT-3训练所需GPU

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:Brown T, Mann B, Ryder N, et al. Language models are few-shot learners[J]. Advances in neural information processing systems, 2020, 33: 1877-1901,Nvidia官网,中金公司研究部

AI大模型对云端算力的需求有望带动IDC市场规模持续扩容。 据IDC圈,2022年国内IDC市场规模1,368亿元,同比增长13.81%,并预计至2025年,国内IDC市场规模将达2,165亿元,对应2022-2025年CAGR为17%。我们认为,随着我国各地区、各行业数字化转型加速推进、AI训练需求持续增长、智能终端实时计算需求增长,IDC市场规模有望持续增加。

图表4:中国IDC市场规模

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:IDC圈,中金公司研究部注:统计口径为基础电信运营商与第三方服务商IDC收入,含机柜租赁、带宽及增值服务收入

中国厂商加速AI大模型投入,东部核心城市的算力资源缺口加大

各科技厂商是目前AI云端算力的主要需求方。 目前AI服务器出货量占整体服务器出货量的比例仍较低,根据TrendForce预估,2022年搭载GPGPU的AI服务器年出货量约13万台,占整体服务器采购量的1%。我们看到,各互联网厂商为主要的AI服务器采购需求方,根据TrendForce数据,2022年全球AI服务器采购需求中,北美四大互联网厂商Google、亚马逊AWS、Meta、微软合计贡献66.2%,中国厂商字节跳动(6.2%)、腾讯(2.3%)、阿里巴巴(1.5%)、百度(1.5%)合计贡献11.5%。据IDC圈数据,2022年国内IDC行业下游客户占比中,公有云厂商及互联网厂商仍为最主要的市场需求方,占整体行业需求比例分别为42.5%和43%。

图表5:AI服务器采购量占比(2022年)

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:TrendForce,中金公司研究部

图表6:中国IDC行业下游客户占比(2022年)

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:IDC圈,中金公司研究部

国内厂商相继布局AI大模型。 自2019年以来,百度相继推出ERNIE、ERNIE2.0、ERNIE3.0大模型,2021年12月推出的ERNIE3.0TitanNLP大模型参数量达到2,600亿。其余互联网厂商亦有所布局,阿里达摩院于2021年4月推出270亿参数、1TB+训练数据的PLUG模型;腾讯于2022年4月腾讯推出混元AI大模型,在五大最具权威的跨模态视频检索数据集榜单中取得第一名;2022年5月,字节跳动发布与清华大*联学**合研发的DA-Transformer并行生成模型。

我们看到,自OpenAI推出ChatGPT应用以来,国内各大科技企业开始加码AI大模型及其应用落地。 其中,京东于2月10日宣布推出产业版ChatGPT ChatJD,预计未来ChatJD智能人机对话平台参数量达千亿级[4];百度宣布旗下大模型产品“文心一言”于3月16日开启内测[5];三六零创始人周鸿祎在2023数字安全发展与高峰论坛上现场展示360GPT[6];阿里云4月7日宣布“通义千问”大模型开启企业邀请测试[7]。此外,4月8日,华为云AI领域首席科学家田奇在人工智能大模型技术高峰论坛分享了华为盘古系列大模型的研发与应用落地情况[8];4月10日,商汤科技推出“日日新SenseNova”大模型体系[9]。

我们认为,AI大模型作为科技领域的重大变革,已经成为科技企业争相占据的技术高地,未来有望看到新的AI大模型及应用陆续推出。

图表7:中国各大厂商AI大模型布局情况梳理

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:各公司官网,机器之心,IT之家,中金公司研究部

我们看到,一方面,国内布局AI大模型的厂商大多聚集在北京、上海、深圳、杭州等国内核心城市,而一线城市虽然IDC资源及需求集中,但扩张受限;另一方面,国内厂商加速布局AI大模型的趋势已经确立,由此催生的AI算力需求或将导致国内核心城市的IDC算力供给缺口加大。

根据CDCC数据,截至2021年10月,华北、华东和华南地区机柜数量合计达328万台,而东北、西部、中部、西南地区机柜仅为87万台,一线城市及其周边地区算力资源集中。但由于能源、土地限制,东部核心城市IDC新/扩建受到指标和能耗的严格限制。

指标管制方面,2020年以来,东部核心城市采取全面禁止/部分禁止/增量控制等方式限制新增IDC,鼓励数据中心从一线城市向周边地区、中西部地区辐射,缓解IDC给一线城市带来的用地和用电压力。

能耗管制方面,政府通过设定PUE[10]上限值严格把控新建项目能耗管理水平,推动建设规模趋向集中化。

图表8:国内核心城市IDC指标管制和能耗管制情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:北京市政府官网,贵州市大数据发展管理局,上海市经济信息化委,广东省发改委官网,杭州市政府官网,中金公司研究部

图表9:主要省市数据中心机柜存量

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:CDCC,自然资源部,中金公司研究部;注:截至2021年10月31日

AI大模型有望助推“东数西算”算力网络建设

智算中心与西部数据中心的要求适配,有望侧面推动“东数西算”

“东数西算”工程支撑数字化经济快速发展。 国家发改委联合多部门于2022年2月印发文件,在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州和甘肃8地全面启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此, 全国一体化大数据中心体系完成总体布局,“东数西算”工程正式启动。 “东数西算”通过构建数据中心、云计算、大数据一体化的新型算力网络系统,将东部算力需求有序引导至西部,优化数据中心建设布局。

优化区域算力供需失衡问题,“东数西算”工程引导数据中心规模化、集约化、绿色化发展。 我国数据中心处于快速发展的阶段,根据国家发改委,截至2022年初,我国数据中心规模达到约500万标准机架,算力达130EFLOPS,发改委预计每年仍将以超20%的增速快速增长,但我国数据中心存在东西部发展不协调、资源与需求不匹配的问题。我们认为,“东数西算”能够优化现有数据中心布局,按需分配东西部枢纽资源,在提升算力的同时,降低网络、电力等成本,助力数据中心规模化、集约化、绿色化发展。

图表10:“东数西算”工程全国布局图

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:国家发改委,自然资源部,中金公司研究部

“东数西算”有望通过集约化,提高全社会算力。 我国数据中心集中于需求较高的东部,但由于能源、土地资源限制,东部数据中心分布较为碎片化且拓展空间有限。西部可再生资源、土地资源相对丰富,但需求不足导致资源优势未得到有效利用。“东数西算”统筹规划算力建设及调度,支持大型及超大型数据中心建设,有利于发挥区位优势,推动数据中心集约化发展。

图表11:“东数西算”工程对各算力枢纽节点的要求

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:国家发改委,中金公司研究部

中西部地区能源充足且散热条件良好,有助于数据中心的绿色化并降低电力成本。 根据中国信通院,2021年我国数据中心总耗电量达到2,166亿千瓦时,占全社会用电量的2.6%[11]。“东数西算”工程要求数据中心的PUE控制在1.25以下。与东部地区相比,西部枢纽节点城市的全年平均气温较低,散热条件良好,能够降低数据中心的温控能耗,从而有效控制PUE值;西部地区电力资源丰富、电力成本低,同时,数据中心能够就近消纳绿色能源(如新能源发电等),减少长距离电力传输造成的损耗并推动数据中心绿色化发展。

图表12:“东数西算”各节点气候和气温情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国天气,天气网,中金公司研究部

数据中心具有高能耗的属性,电力供给充足稳定以及电价合理是吸引数据中心选址的重要因素。

从电价的角度看,根据北极星电力网,位于西部的数据中心节点所在省市售电电价显著低于东部地区,以2023年4月为例,宁夏售电电价为284.40元/兆瓦,而广东省达到561.80元/兆瓦(近2倍)。此外,部分西部节点给予大型数据中心电价/交易政策优惠。根据贵州省大数据发展管理局,贵安新区直管区范围内大型数据中心(服务器10万台以上,机架6000个以上)实行0.35元/千瓦时的电价政策。

从电力供应的富余度看,以贵州、内蒙古为代表的中西部数据中心节点所在省份能源充足并向外省输出富余电能,净调出量在发电量中占比超过20%;而北京、上海以及东南沿海省份则不同程度依赖外省能源,其中北京/上海净调入量在发电量中占比达到了161%/74%。

图表13:“东数西算”各节点所在省份电价情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:北极星电力网,中金公司研究部

图表14:各省能源情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:国家统计局,中金公司研究部;注:为2021年统计数据

AI大模型高算力及高能耗需求,适配“东数西算”工程的算力转移要求。

► 高算力: AI大模型参数量的提升对AI服务器需求量也形成支撑,以OpenAI训练集群模型估算结果作为参考,标准大小的175亿参数GPT3模型大概需要375-625台8卡DGXA100服务器进行训练(耗费10天左右时间),在各厂商加速布局AI大模型的背景下,训练用AI服务器市场有望迎来扩容;同时,AI大模型的应用落地及用户数的大幅提升,也有望带来AI服务器需求量的提升。

► 高能耗: 我们以单次训练GPT3模型需要500台8卡DGX A100服务器,耗费时间10天为基准,分别计算在西部和东部地区数据中心训练一次GPT-3模型所需的电力总成本,发现在宁夏地区训练耗费电力成本约22万元,相同场景下,在广东省则需花费近44万元。

图表15:Chat GPT-3单次训练电费成本测算

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:Nvidia官网,OpenAI官网,北极星电力网,中金公司研究部

政策端加速推进算力建设和统筹调度,有望进一步推动“东数西算”工程落地。 2023年4月17日,科技部高新技术司组织召开了国家超算互联网工作启动会,成立国家超算互联网联合体,通过算力网络连接全国众多超算中心的方式,构建一体化算力服务平台,并计划到2025年底,国家超算互联网将可形成技术先进、模式创新、服务优质、生态完善的总体布局[12]。4月19日,上海市经信委发布《上海市推进算力资源统一调度指导意见》,提出到2023年底,依托上海市人工智能公共算力服务平台,接入并调度4个以上算力基础设施,可调度智能算力达到1,000 PFLOPS(FP16)以上;到2025年,市人工智能公共算力服务平台能级跃升,完善算力交易机制,实现跨地域算力智能调度,通过高效算力调度,推动算力供需均衡,带动产业发展作用显著增强[13]。 我们认为,政策端持续推进发力,有望加速“东数西算”建设,加快算力向西部迁移的进程。

西部数据中心“十四五”规划积极,为“东数西算”工程落地提供支持

西部地区积极规划“十四五”数据中心建设。 通过梳理宁夏、贵州、内蒙古、甘肃、四川、重庆6个西部省市及自治区的“十四五”规划,我们看到6地区的机架数量有望从2020年约42万架提升至2025年的362万架,为“东数西算”工程渐次落地提供了有力支持。我们认为,“东数西算”工程有望加速落地,我国数据中心布局或将得到进一步优化。

► 宁夏: 根据宁夏回族自治区信息化建设“十四五”规划,宁夏计划到2025年建成10个以上IDC、超过72万架IDC标准机架,2020-2025年IDC机架规模CAGR为88.8%。“十三五”期间国家(中卫)新型互联网交换中心已正式揭牌,西部云基地数据中心标准机架数达3万架,服务器总装机能力已达到50万台,上线服务器近30万台,能源使用效率(PUE)最低达到1.1。[14]

► 贵州: 根据贵州省信息通信业“十四五”规划,2025年贵州省将实现100万架IDC标准机架、400万台服务器的建设目标。[15]

► 内蒙古: 根据内蒙古自治区信息通信业“十四五”发展规划,截至2020年,内蒙古已建及在建6万架数据中心标准机架,其中,在用数据中心36个,机架规模3.6万架,预计到2025年数据中心机架规模将达到10万架。[16]

► 甘肃: 根据甘肃省信息通信行业发展规划(2021-2025年),截至2020年底,甘肃省在用数据中心为61个,机架规模为10.95万架,预计到2025年,机架规模达到100万个, 2025年平均上架率目标从39.5%提升至50%,大型及超大型数据中心/整体平均设计PUE值小于1.3/1.35。[17]

► 四川: 根据四川省“十四五”新型基础设施建设规划,截至2020年,全省已建成数据中心107个,其中大型及超大型数据中心10个,在用机架规模超10.5万个,目标到2025年数据中心机架规模增加至50万架。[18]

► 重庆: 根据重庆市信息通信行业发展规划(2021-2025年),截至2020年重庆市具备11.9万架数据中心机架,规划到2025年机架规模达到29.6万架。[19]

图表16:中国数据中心机架规模

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国信通院,工信部,中金公司研究部

图表17:中国各区域数据中心机架存量规模

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:CDCC,中金公司研究部

通信传输能力或成算力迁移核心挑战,网络运力升级在望

通信传输能力是贯彻“东数西算”战略的关键

西部算力资源长期发展与带宽、时延密不可分,网络运力亟待升级。 根据工信部数据,2010-2022年我国电信业务主要集中在东部地区,2022年东部和西部电信业务收入比重分别为51.3%、23.9%[20]。根据信通院发布的《中国综合算力指数(2022)报告》,东部地区运力指数明显高于西部,全国运力指数Top10省份中西部地区仅四川入列,主要受制于单位面积5G基站数、互联网专线用户、单位面积长途光缆距离和数据中心网络出口带宽等因素。我们认为,长期来看,要实现“东数西算”的高质量推进,打破算力资源向西部有序迁移的瓶颈,其核心在于提升西部的网络运力水平,构建大带宽、低时延、高可靠性的高速运力大动脉。

西部地区有丰富的土地和能源优势,随着网络基础设施的改善有望成为全国算力中心。 以全球第一大数据中心美国北弗吉尼亚州为例,其凭借充足的电力、高土地可用性、低电价和税收减免等,吸引亚马逊、谷歌、Netflix等大型互联网公司在该地运营自己的数据中心。与北弗吉尼亚州类比,我国西部地区也拥有天然的土地和电力优势。根据国家能源局信息,2018年内蒙古的平均销售电价为0.356/kWh,比全国平均销售电价(0.599/kWh)低了约40%。此外,北弗吉尼亚州丰富的光纤线路资源也是吸引云厂商的重要特质,美国于2020年计划在整个弗吉尼亚州建立地下多导管光纤网络,进一步提升网络能力。我们认为要实现东数西算工程的长期落地,我国西部地区的网络基础设施仍有较大提升空间,时延和带宽能力有待提高。

图表18:2010-2022年东、中、西、东北地区电信业务收入比重

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:工信部,中金公司研究部注:东北地区自2014年起被纳入统计

图表19:2022年中国运力指数Top10省份

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国信通院《中国综合算力指数报告》(2022年),中金公司研究部注:运力指数包括网络运力质量(含数据中心网络出口带宽、数据中心网络时延、固定宽带平均*载下**速率、移动宽带平均*载下**速率、千兆光网覆盖率)和基础网络条件(含国家级互联网骨干直联点、省际出口带宽、单位面积5G基站数、互联网专线用户、互联网宽带接入端口、单位面积长途光缆)2个二级指标。

不同算力应用场景对传输侧的带宽和时延能力需求存在差异。 我们认为西部地区可承载的业务范围主要取决于三个能力—— 算力、传输带宽、传输时延 。在前文篇章讨论了西部算力建设的基础上,我们认为改善西部区域的出口带宽和传输时延是扩大“能力圈”的核心。 1)时延需求: 根据国家发改委[21],从数据应用需求侧看,约 5-10% 的应用为时延要求在10ms以内的低时延热业务,如AR/VR、视频渲染、实施采集决策等,这些应用实时性要求较高,需要调用本地/区域IDC算力;约 65-70% 的应用为时延需求在10-30ms区间的温业务,如工业控制、AI推理等,这些应用对时延相对敏感,可部署在区域或城市及其周边位置;约 20-30% 业务是时延要求超过30ms的冷数据,如AI训练、超算和大数据处理等。 2)带宽需求: 业务数据量同步影响着带宽需求和算力需求,一般来说,算力需求高的应用,带宽需求也更高。

短期来看,东数西算工程主要适用于东数西存、东数西训等时延要求较低而算力需求较高的业务迁移到西部。长期来看,我们认为随着西部基础网络条件的改善,西部整体网络运力质量有望提升,数据中心能力圈有望如图表20从外圈向内圈拓展,可承载的业务范围有望增加。

图表20:不同应用场景对承载和算力的需求

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国信通院《算力时代网络运力研究报告》(2022年),中金公司研究部

西部带宽:算间互联牵引需求,十四五规划指引出口带宽升级方向

西部宽带普及率和带宽速率均低于全国平均水平,网络性能有待改善。 根据宽带发展联盟,截至2018年第4季度,西部固定宽带家庭普及率和移动宽带用户普及率分别为80.2%和88.1%,分别比东部地区低了18.6ppt和19.9ppt。《2021年第四季度中国宽带速率状况报告》显示[22],西部固定带宽平均*载下**速率为61.39 Mbit/s,比东部固定宽带平均*载下**速率低了1.76 Mbit/s,其中青海、*疆新**、*藏西***载下**速率不足60 Mbit/s。

图表21:4Q18我国不同地区宽带普及率

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:宽带发展联盟,中金公司研究部

图表22:4Q21固定带宽平均*载下**速率区域对比

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:宽带发展联盟,中金公司研究部

算间互联需要大带宽支撑,西部运力枢纽出口带宽面临挑战。 根据中国信通院《全光运力研究报告(2022年》,[23]结合部分省市发布的枢纽集群建设规划,信通院预计到2025年东数西算十大集群节点的单枢纽出局带宽有望达到百T级别,当完成规划的机架数时,骨干网带宽预计将增加1000T以上;此外,西部枢纽主要服务于全国范围的算力需求,信通院预测未来出省带宽比例有望超过70%。工信部最新披露的西部省份互联网省际出口带宽数据显示[24],2022年四川和贵州出口带宽分别为86.7Tbps和38.0Tbps,2021年宁夏和甘肃(两省未披露2022年数据)出口带宽分别为9.6Tbps和23.4Tbps,均尚未达到未来运力枢纽节点对出局带宽的要求,枢纽之间的运力带宽资源不足或影响传输时延。

西部地区省际出口带宽指引积极,数据传输设备建设加速。 从东数西算涉及的西部地区来看,根据各地区十四五规划,十四五期末带宽水平均要达到15Tbps以上;至2025年宁夏、内蒙古、贵州、甘肃、四川、广西规划的出口带宽预计为15Tbps、67Tbps、44Tbps、29Tbps、50Tbps、45Tbps,分别对应28%、24%、21%、14%、10%、5%的2020-2025年CAGR。我们认为东数西算建设对算力枢纽运力带宽需求的提升,有望加速推进宁夏、内蒙古、贵州等地的传输骨干网建设和升级。

图表23:部分省份出局带宽预估与省级出口带宽现状

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国信通院《全光运力研究报告》(2022年),中金公司研究部

图表24:部分西部省份省际出口带宽增长预测

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:各省市政府官网,工信部,中金公司研究部

西部时延:骨干直联&全光网建设加速,改善东西部网络时延

端到端网络时延及质量受区域及距离影响较大。 根据《我国典型地区数据中心网络性能分析报告》(2020年)[25],城市间的网络时延差异较大,从60~95毫秒不等。相比于张家口到北京(直线距离大约163公里,端到端时延为64ms),成都到北京的直线距离约1500公里,端到端时延约95ms,网络时延拉长。我们认为除地理距离较长外,西部地区核心骨干网数量较少、国家级互联网骨干直联点不足亦导致路径绕转增加时延。根据国务院《全国一体化大数据中心协同创新体系算力枢纽实施方案》指导性意见,数据中心端到端单向时延(不包括结点处理时延和排队时延)原则上在20ms以内[26],因此西部跨域远距离传输能力有待进一步优化和提升。

网络骨干直联建设有望提质增容。 互联网骨干直联点是国内不同电信运营商网络互联互通的连接点,能够降低跨区域间的流量绕转并实现流量就地交换。根据工信部,截至目前,三大电信运营商已统筹建成21个直联点,兰州、合肥、昆明在建。根据各市政府网,贵州于2017年开通直联点,目前已实现与北京、上海、广州、深圳等32个城市直连,计划到2024年骨干直联点互联链路带宽扩容到600Gbps;呼和浩特于2021年开通直联点后,经测试内蒙古区内网间平均时延由原来的29.11ms左右降低至3.3ms左右,跨省网间平均时延由原来的41.57毫秒左右下降至37.08ms左右;宁夏于2022年开通直联点,预计到2023年实现到杭州、上海单向网络时延在16ms以内,到深圳单向时延在22ms以内。

图表25:2020年部分端到端网络时延

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国信息通信研究院云计算与大数据研究所,中金公司研究部注:端到端网络时延相比单向时延多了结点处理时延和排队时延

图表26:国家级互联网骨干直联点建设图示

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:工信部,自然资源部,中金公司研究部注:统计时间截至2023/4

光纤通信向全光网加速演进,夯实大容量运力底座。 全光网络是一种使用光学传输介质实现数据传输的网络,网络中以光节点取代现有电节点。相较于传统的网络结构,全关网的优势包括:(1)超大带宽:全光网在网络传输和交换过程全部通过光纤实现,根据51CTO,全光网宽带的带宽可以达到50~100Mbps;(2)超低时延:全光网采用可重构型光分插复用设备(ROADM)区域网络与省一体化规划,能够根据算力布局优化网络结构以确保时延最优;(3)泛在覆盖:全光底座可以实现全光锚点下沉,以满足用户算力的就近接入并扩大覆盖范围,从而实现ToB、ToH、ToC算力业务多样性接入与综合承载。面向“东数西算”场景,全光底座可以通过全光交换节点实现光层直达,进而减少电层设备引入的节点处理时延,构建以算力枢纽节点等为中心的多层次时延圈。如图25所示,在东西部的算力集群之间构建20ms的时延圈,在距离较近的城市群间和城市内部构建1~5ms时延圈,灵活部署以满足算力应用业务的多样需求。

图表27:全光运力底座时延圈

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国信通院《算力时代网络运力研究报告》(2022年),中金公司研究部

光传输设备:供应格局较稳定,OTN技术向单载波400G演进

从当前阶段国内建网趋势看,OTN(optical transport network,光传送网)已成为主流传输标准,特别是在运营商的干线网、城域网建设中,基本都采用了OTN技术,通过支线路分离的架构实现组网的灵活部署和业务的快速开通、同时降低了网络建设成本。我们认为,OTN技术兼具SDH(同步数字体系)和WDM(波分复用)技术的优势,适配长距离、高带宽、低时延、可灵活调配的网络传输,有望在长时间维度下实现广泛应用。

OTN设备供应格局稳定,份额集中于头部厂商。 2022年6月,中国移动公布2022-2023年OTN设备(包括一般OTN设备、省级干线OTN设备、国际政企专网境内系统OTN设备)扩容中标情况,华为、中兴、烽火和诺基亚贝尔分别获得68.8%、17.8%、12.0%和1.2%的份额。同月,中国移动又公布了2022年-2023年OTN设备新建部分集采中标候选人,中兴、华为、烽火的中标份额分别为50%、27%和23%。我们观察到干线、城域核心层/汇聚层所需的OTN设备,其技术壁垒较接入型OTN产品更高、采购规模也更大,供应份额更加集中于技术和品牌实力突出的头部厂商。

图表28:2022-2023年中国移动OTN设备扩容情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国移动采购与招标网,中金公司研究部

图表29:2022-2023年中国移动OTN设备新建部分中标情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:中国移动采购与招标网,中金公司研究部

“东数西算”网络建设对光传送网提出更高要求,推动OTN技术代际演进。 算力网络从架构、带宽、时延等方面对光传送网提出了转型升级诉求,中国移动研究院张德朝在2022中国光通信高质量发展论坛上表示[27],提升单载波速率是下一代骨干传送网深度匹配入算业务、算间业务的关键举措,OTN技术有望从单波100G/200G向400G速率演进。中国移动于2021年完成400G(16QAM-PCS)实验室和现网试点,传输能力从600km提升至1000km;中国联通于2023年3月联合华为在浙江建成全国最大规模的400G OTN实验网,其最远传输距离超过900km,可满足省内干线网络和城域核心节点间的传输。此外,三大运营商均已开展400G OTN+G.654.E光纤的现网验证测试,我们认为配套新型光纤应用有望加速推进400G在骨干网的商用落地,助力东数西算运力升级。

光纤光缆:直连需求增加,网络拓扑和光缆产品齐升级

东数西算工程拉长省际传输距离,光缆传输线路需求提升显著。 根据工信部各年度通信统计公报,中国光缆线路长度由2010年底的995万公里增长至2022年年底的5958万公里,其中2022年底长途光缆线路长度、本地网中继光缆线路和接入网光缆线路长度分别达到109.5万公里、2146万公里和3702万公里,传统电信业务、消费互联网业务侧需求覆盖度较高。自2022年2月东数西算工程正式启动,2022全年新增光缆线路长度477.2万公里,同比增长49.6%。我们认为,东数西算工程旨在打通算力枢纽之间的高速数据传输、东西部数据直连通道,有望拉长省际传输距离,我们预计算力枢纽之间和集群内部的光纤直连需求将提升。

根据东数西算涉及的部分西部地区的“十四五”规划,贵州省、四川省、云南省披露了关于光缆线路的建设目标。

► 贵州: 根据贵州信息通信业“十四五”规划,贵州省2020年光缆线路长度为123万公里,“十四五”规划的发展目标是要新增57万公里,对应2020-2025年CAGR为7.9%。

► 四川: 根据四川省信息通信行业发展规划(2021-2025年),四川省2020年光缆线路长度总长为353.6万公里,“十四五”规划的发展目标是要新增26.4万公里,对应2020-2025年CAGR为1.5%。

► 云南: 根据“十四五”云南省信息通信行业发展规划,云南省2020年光缆线路长度总长为222万公里,“十四五”规划的发展目标是要新增103万公里,对应2020-2025年CAGR为7.9%。

图表30:2010-2022年中国光缆线路新建长度

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:工信部,Wind,中金公司研究部

图表31:部分西部省份光缆线路长度预测

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:工信部,中金公司研究部

优化光缆网络拓扑结构,光层直达以减少时延。 现有光缆网主要用于传统电信业务机房和消费互联网业务的数据中心互连需求。我们认为,要实现对“东数西算”建设中涉及到的八大国家算力枢纽节点和十大国家数据中心集群的全光覆盖,需要优化光缆网络拓扑结构以增加算力节点间的物理连通度,具体举措有:1)进一步完善国家枢纽节点之间的直达路由光缆,以及增加节点的光缆路由方向;2)建设区域内重要城市之间的直达光缆,以保障数据中心集群之间、数据中心内部以及城市群内的低时延、高可靠和高通达互联互通。

东数西算拉动干线光缆加速升级,迈入新型超低损耗光纤时代。 “东数西算”网络布局空间跨度较大,对传输容量和时延的要求提高,100G+光网络升级已成趋势。单载波超过100G的WDM系统,对光信噪比(OSNR)的要求更高。相比干线中此前使用较多的G.652光纤,G.654.E光纤具有大有效面积、低衰减等特性,能有效提升OSNR、延长无电中继传输距离,在长距离高速光网络中起到改善性能、降低部署成本的优势。

我国运营商于2016年左右启动ITU-T G.654.E超低损光纤的应用评估并已完成行业技术标准的制定,2022年中国电信、中国移动完成了商业化规模集采。根据中国移动采购与招标网,2022年4月中国移动公布2022-2023年G.654.E光纤光缆产品集采中标候选人,采购规模约为33.24万芯公里,长飞、亨通和烽火的中标份额分别为50%、27%和23%。同月中国电信完成了干线光缆建设工程集采,其中G.654E干线光缆中标人为长飞、烽火和中天。相较于普缆中标供应商数量一般超过10家,G.654E集采中标份额更加集中,我们认为体现了当前阶段G.654.E品种仍存有一定的量产壁垒。根据长飞光纤在中国信息通信业发展高层论坛的分享,截至2022年9月我国G.654.E光纤已部署超100万芯公里。我们认为加速G.654.E光纤在骨干长途光网络的应用部署有助于国家“东数西算”战略的长期落地,而G.654.E品种的加速使用也有望利好产业技术水平居前的供应商。

光模块:多场景驱动模块增长,高速PON &相干光模块部署升级

我们认为东数西算对传输需求的提升,有望给电信光模块需求带来边际增量,主要包括接入网、传输网和DCI互联,其中PON光模块和相干光模块环节有望结构性受益。

PON光模块:PON技术演进支撑千兆、万兆光网

固网接入全面向千兆升级,推进10G PON光模块部署。 东数西算工程跨地域传输数据的需求需要高质量、大带宽、低时延的千兆光网作为支撑,带动10G PON光模块需求提升。根据工信部,截至2023年2月底,我国具备千兆网络服务能力的10G PON端口数达1659万个,比2022年年末净增136.2万个,已提前完成工信部《“十四五”信息通信行业发展规划》2025年1200万个的目标;2023年2月底千兆及以上接入速率的用户达到1.02亿户,渗透率为17%,较2022年年末提升1.4个百分点。我们认为,作为东数西算的算网根基,千兆网络的渗透率将随着东数西算的推进不断提升,10G PON光模块市场有望跟随千兆光网迎来长期发展机遇。根据LightCounting预测,全球10G PON端口出货量增长强劲,到2025年10GPON及以上端口出货量占PON总端口数比重有望过半。

图表32:我国10G PON端口数增长情况

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:工信部,中金公司研究部

图表33:全球GPON与10G PON及以上端口出货量

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:LightCounting,中金公司研究部

高带宽、低时延需求推动10G PON向50G PON演进。 4K/8K、AR/VR、人工智能、工业智能制造等应用的蓬勃发展对固网带宽和时延均提出了更高要求,推动PON技术加速升级。根据中兴于2020年12月发布的《50G-PON 技术白皮书》,过去十年从GPON向10G PON的升级将带宽提升了4倍,未来5-10年光接入网的发展目标是将每户接入速率提升至1-10Gbps,我们认为50G PON能够提供更大的收敛比以及5倍于10G PON的带宽,且通过专用激活波长(DAW)、CoDBA(协作DBA)和减小分配周期等方式能够实现低时延,有望成为有线宽带下一阶段的部署方向。

相干光模块:相干技术持续下沉,DCI场景推升400G+需求

相干技术适用于长距离传输,逐渐从骨干网向城域网下沉。 骨干网是省级、城市之间的主干数据管道,一般传输距离大于1000km。相较于传统技术,相干技术能够利用光波的偏振、相位等高级属性来提供更高的调制能力,从而扩充传输容量、拉长可传输距离;但同时相干传输系统需要专用的集成电路和数字信号处理器,光收发器结构的复杂度提升,增加了系统成本及功耗,过去主要应用于长距离骨干传输网。我们认为,“东数西算”工程带动新型算力网络建设,连接算力网络最终用户的城域网也将面临扩容升级,单通道传输速率有望提升,相干技术的应用范围将进一步拓宽,逐渐从骨干网下沉到传输距离为100-1000公里的城域网。

数据中心间互联(DCI)推升相干光模块需求。 目前数据中心光互联主要有直接探测和相干两种支撑技术——直接探测技术多用于数据中心内部通信以及短距离数据中心互联;相干探测技术 则凭借高容量、高信噪比等特性,在长距离(一般为40-120km)数据中心集群间互联(DCI)中更具优势。随着光模块速率不断提升,直接探测方案对模块内的光器件及芯片的带宽要求较高,且受高速光纤链路色散影响,传输距离受到一定限制。根据旭创官网,采用直接探测方案的800G光模块能够支持10km的传输,但速率上行到1.6T/3.2T时,直接探测技术所能支撑的传输距离或将缩短至2km。我们认为长期来看相干光模块有望成为DCI场景中高性价比传输解决方案。根据LightCounting预测,2023年数据中心间互联(DCI)占DWDM光模块应用场景的比例(按总带宽)有望从2016年的21%提升到53%,我们认为DCI需求的增加有望拉动400G+相干光模块市场规模快速增长。

图表34:相干光模块在电信和数通场景的应用

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:易飞扬通信官网,中金公司研究部

图表35:DWDM光模块下游应用结构(按总带宽)

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:LightCounting,中金公司研究部

从商业落地看,1)电信市场: 用于电信网的相干光模块产品类型包括100G CFP/CFP2、200G CFP/CFP2、400G CFP2等。根据LightCounting数据,2023年全球200G CFP2光模块出货量预计在35万只左右,在2020-2023年相干DWDM光模块出货中保持份额领先。 2)数通市场: 目前用于DCI互联的相干光模块产品类型主要有400G QSFP-DD ZR、400G QSFP-DD ZR+等,接口协议标准包括OIF 400ZR、OpenZR+。根据LightCounting数据,2023年全球400G ZR/ZR+出货量有望超过30万只,在相干DWDM光模块中的出货占比预计从2021年的17%提升至2023年的42%。展望未来,我们认为随着下一代相干技术趋于成熟、推动相关标准逐渐落地,面向DCI应用的相干光模块市场规模有望保持快速增长。

图表36:各速率相干DWDM光模块出货量及预测

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:LightCounting,中金公司研究部

从内部构成看, 相干光模块的结构较传统光模块复杂,关键器件包括相干光学子组件(COSA)和数字信号处理芯片(DSP),COSA又集成了可调谐激光器模块(ITLA)、集成相干接收模块(ICTR)和相干驱动调制器(CDM)。 落到在位厂商业务侧, 我们认为相干光模块壁垒较高,因此竞争格局优质,且产品毛利率水平高于光模块市场整体,有望为具有相干光学子组件自研能力以及DSP芯片稳定供应的模块厂商注入业绩增量。

图表37:相干光模块内部结构

中金|AI浪潮之巅系列:东数西算,数据大动脉

资料来源:Fiber Mall,SiFotonics,中金公司研究部

风险

人工智能发展不及预期。 随着社会数字化及智能化转型的持续,人工智能加速赋能百行百业。我们认为,人工智能的蓬勃发展驱驱动了社会算力需求的提升,包括服务器、网络通信设备等上游硬件基础设施或将受益于人工智能的驱动的算力需求提升,如果人工智能的技术迭代发展不及预期或规模应用落地不及预期,会对上游硬件基础设施的需求造成不利影响。

数据中心的建设不及预期。 2022年工信部联合多部委正式全面启动“东数西算”工程,旨在对全国的算力分布进行统筹布局,有望推动西部数据中心建设规模的提升。如果数据中心建设不及预期,可能会对上游硬件设备的市场增速产生不利影响。

[1]FLOPS被视为主要算力指标。常见的算力衡量单位包括MIPS(每秒钟执行的百万指令数)、DMIPS(Dhrystone每秒钟执行的百万指令数)、OPS(每秒操作次数)、FLOPS(每秒浮点运算次数)、Hash/s(每秒哈希运算次数)等。

[2]单位巨大量级的表示方式:K(Kilo)表示103、M(Mega)表示106、 G(Giga)表示109、 T(Tera)表示1012、 P(Peta)表示1015、 E(Exa)表示1018、 Z(Zetta)表示1021、 Y(Yotta)表示1024。

[3]https://news.microsoft.com/source/features/ai/openai-azure-supercomput

[4]https://jdcorporateblog.com/jd-cloud-launches-chatjd-to-integrate-chatgpt-into-technology-products-and-services/

[5]https://cloud.baidu.com/news/news_e7fbd152-286e-4ae5-bba8-2bd0ef150d96

[6]https://bbs.360.cn/thread-16083839-1-1.html

[7]https://ali-home.alibaba.com/document-1582482069362049024

[8]https://www.caai.cn/index.php?s=/home/article/detail/id/2492.html

[9]https://www.sensetime.com/cn/news-detail/51166399?categoryId=72

[10]PUE=数据中心总设备能耗/IT设备能耗

[11]https://mp.weixin.qq.com/s?__biz=MzA3MDU5NzI3MQ==&mid=2651274264&idx=2&sn=ade88b2fdc28d80a72627de26e2ad246&chksm=84c9f3e0b3be7af66cc76a2032ca212b1ad078962fc6bce8ae61f40537782392b64daff2ab1a&scene=27

[12]http://www.ce.cn/cysc/tech/gd2012/202304/19/t20230419_38505754.shtml

[13]https://app.sheitc.sh.gov.cn/cyfz/694813.htm

[14]https://www.nx.gov.cn/zwgk/qzfwj/202201/t20220113_3282618.html

[15]http://dsjj.guiyang.gov.cn/newsite/zwgk/zfxxgk_5848436/fdzdgknr/ghjh/fzgh/202204/P020220418546756343414.pdf

[16]https://www.nmg.gov.cn/zwgk/zcjd/plwz/202106/t20210621_1640025.html

[17]https://gsca.miit.gov.cn/cms_files/filemanager/1508294071/attach/202110/08cbfb71511345e18f1dda76c476ebf4.pdf

[18]https://scca.miit.gov.cn/cms_files/filemanager/907903353/attach/20219/fe842e801abb4670b5dda5aaccafb345.pdf

[19]http://dsjj.cq.gov.cn/zwgk_533/fdzdgknr/ghxx/202206/W020220613434406315311.pdf

[20]http://www.gov.cn/xinwen/2023-02/02/content_5739680.htm

[21]https://www.ndrc.gov.cn/xwdt/ztzl/dsxs/zjjd1/202203/t20220321_1319864.html

[22]http://www.chinabda.cn/article/252783

[23]http://www.caict.ac.cn/kxyj/qwfb/ztbg/202302/t20230217_415734.htm

[24]https://scca.miit.gov.cn/zwgk/xysjtj/art/2022/art_07ba18b871384554b423be93f37c38d9.html

[25]https://mp.weixin.qq.com/s/9kX0WH6J-kWgta3whrCrYg

[26]https://www.ndrc.gov.cn/xwdt/ztzl/dsxs/zcwj2/202201/t20220112_1311853.html

[27]https://www.c114.com.cn/news/118/a1193093.html

文章来源

本文摘自:2023年4月24日已经发布的《AI浪潮之巅系列:东数西算,数据大动脉》

陈昊 分析员 SAC 执证编号:S0080520120009 SFC CE Ref:BQS925

朱镜榆 联系人 SAC 执证编号:S0080121070370

李诗雯 分析员 SAC 执证编号:S0080521070008 SFC CE Ref:BRG963

郑欣怡 联系人 SAC 执证编号:S0080122070103

孔杨 联系人 SAC 执证编号:S0080122110018

彭虎 分析员 SAC 执证编号:S0080521020001 SFC CE Ref:BRE806

法律声明

中金|AI浪潮之巅系列:东数西算,数据大动脉