科大讯飞的中报业绩预告同比下降71%—80%,扣非后净亏损2.7亿元-3.3亿元。这份业绩预告看起来比较丑, 但机构的关注更多在他二季度的环比增速上 。
科大讯飞第二季度的经营扭转了第一季度业绩下滑的不利局面 ,营收预计环比增长约70%,毛利预计环比增长约60%。同时公司提到下半年会all in 大模型,加快星火大模型的商业落地,引发今日资金关注,带动AI板块反弹。
那么 ,科大讯飞all in 的大模型优势有哪些?现在国内有哪些知名大模型?大模型加速了AI在哪些产业场景的落地?哪些公司涉及到大模型。 我们今天深度了解下。
一、ChatGPT带来的变革——大模型算法
1. 大模型的优势。
以往的数学理论表明,随着参数增多、模型增大,过拟合导致模型的误差会先下降后上升,这使得找到精度最高误差最小的点成为模型调整的目标。而随着人工智能算法算力的不断发展,研究者发现如果继续不设上限的增大模型,模型误差会在升高后第二次降低,并且误差下降会随着模型的不断增大而降低, 通俗而言模型越大,准确率越高。 因此人工智能发展进入了大模型时代。

资料来源:华安证券研究所
相比传统AI模型, 大模型的优势体现在:
1)解决AI过于碎片化和多样化的问题,极大提高模型的泛用性。 应对不同场景时,AI模型往往需要进行针对化的开发、调参、优化、迭代,需要耗费大量的人力成本,导致了AI手工作坊化。大模型采用“预训练+下游任务微调”的方式,首先从大量标记或者未标记的数据中捕获信息,将信息存储到大量的参数中,再进行微调,极大提高模型的泛用性。
2)具备自监督学习功能,降低训练研发成本。 我们可以将自监督学习功能表观理解为降低对数据标注的依赖,大量无标记数据能够被直接应用。这样一来,一方面降低人工成本,另一方面,使得小样本训练成为可能。
3) 摆脱结构变革桎梏,打开模型精度上限。 过去想要提升模型精度,主要依赖网络在结构上的变革。随着神经网络结构设计技术逐渐成熟并开始趋同,想要通过优化神经网络结构从而打破精度局限变得困难。 而研究证明,更大的数据规模确实提高了模型的精度上限。
2. 首要关键技术:Transformer模型
选择合适的模型架构是至关重要的一步,模型的架构决定了它处理数据和学习任务的能力。在对9家中国AI团队的调研中,我们发现 Transformer架构是这些公司最大模型普遍采用的架构 ,这一发现揭示了Transformer架构在当下AI领域的重要地位。
在未来的一段时间内,Transformer可能会保持相对的领导地位。 2017年transformer架构首次被提出,至此以后该架构构成了现代AI训练神经网络的基石,从google的BERT到现在OPEN AI的GPT4,都是基于Transformer的自注意力机制上建立的。

资料来源:华安证券研究所
3. AI模型新发布可期,复杂数据处理升级。
大模型预计发布的领域主要集中在自然语言处理(NLP)、计算机视觉(CV)和跨模态三个方面。目前,NLP和CV是人工智能领域较成熟和活跃的两个方向, 而跨模态是近年来兴起的一个新兴方向。这些领域都拥有丰富的数据资源和多样化的应用场景,为大模型的发展提供了基础和动力。

资料来源:天风证券研究所
二、国内大模型布局梳理
1. 科大讯飞星火大模型。
2023年6月9日, 公司正式推出星火认知大模型V1.5版本,开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。 8月15日,将突破代码能力,多模态交互再升级;10月24日,通用模型对标ChatGPT(中文超越,英文相当)。

资料来源:德邦证券研究所
2. 腾讯:混元大模型。
2022年4月, 腾讯首次对外披露HunYuan大模型 ,协同了腾讯预训练研发力量,完整覆盖NLP大模型、CV大模型、多模态大模型及众多行业/领域任务模型。
HunYuan先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务,降本增效。
依靠HunYuan的多模态理解能力,在广告内容理解、行业特征挖掘、文案创意生成等方面的应用,在为腾讯广告带来大幅GMV提升的同时, 也初步验证了大模型的商业化潜力。

资料来源:德邦证券研究所
3. 阿里:通义大模型:让AI更通用
2022年9月,在阿里巴巴达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上, 发布“通义”大模型系列,并宣布相关核心模型向全球开发者开源开放。
阿里达摩院基于其AI 统一底座构建了通用模型与专业模型协同的层次化人工智能体系。
统一底座层: M6-OFA模型作为单一模型,在不引入新增结构的情况下,可处理超过30种跨模态任务。
通用模型层: NLP模型“通义–AliceMind”;CV模型“通义-视觉”;多模态模型“通义-M6”。
专业模型层: 深入电商、医疗、娱乐、设计、金融、工业、制造业等行业。

资料来源:德邦证券研究所
三、大模型加速AI在产业场景的落地
AI已深度赋能各行各业,大模型的出现有望加速落地进程。 工信部数据显示,截至2022年底国内已有近4000家AI企业在各自细分赛道深耕,包括安防、互联网、金融、工业、医疗等诸多行业。受技术水平的限制,此前部分功能的实现效果差强人意。大模型的出现有望加速落地此前未能落地之应用、或实现此前未能实现之功能,其优势得以显现。
1. 大模型在工业,协助提升机器视觉定位、识别任务的效率。 机器视觉系统是“工业之眼”,由光源、镜头、相机、软件等构成,实现识别、测量、检测、定位等功能。 大模型优势在于识别、定位等任务,在测量、检测等精细化任务中,仍需要与AI小模型相结合,才能更好地满足下游垂类应用场景的需求。

资料来源:中金公司研究所
2.大模型在汽车,加速驾驶算法迭代,优化座舱交互体验。 根据高工智能汽车,2022年国内乘用车L2 ADAS与数字座舱渗透率分别达29.4%、39.9%,汽车智能化方兴未艾。
大模型如何赋能智能汽车产业?
1)智能驾驶中 ,大模型能够在云端算法训练环节,生成罕见路况用于训练,补充corner case, 提升长尾场景决策能力 ;

资料来源:中金公司研究所
2)智能座舱中 ,以语音交互为例,虽渗透率已近80%,但交互形式以指令问答为主,较为机械。“重体验、强交互”趋势下,大模型能够增强车载语音多轮对话、上下文理解能力, 有望革新交互体验 。

资料来源:中金公司研究所
3.大模型在安防,赋能“城市之脑”,提升城市运转效率。 智慧城市、智慧交通等新兴应用需求不断增长,数字乡村、数字经济等领域相关政策持续加码,社会数字化转型趋势有望拉动城市安防需求的成长。
大模型有望赋能城市底层业务的统一感知、关联分析和态势预测, 更好地实现城市决策与治理 ,城市安防作为感知、决策、预测的重要窗口有望充分受益。

资料来源:中金公司研究所
四、大模型相关公司梳理
1. 大模型算法:商汤科技、科大讯飞、云从科技、依图科技、旷视科技。
2. 游戏线: 神州泰岳、名臣健康、完美世界、网易、巨人网络、昆仑万维、三七互娱、吉比特、恺英网络、汤姆猫、腾讯控股、中手游、盛天网络、电魂网络、星辉娱乐、游族网络、宝通科技、冰川网络。
3. 教育+出版线: 南方传媒、凤凰传媒、浙版传媒、中南传媒、佳发教育、盛通股份、学大教育、科德教育等。
4. 电商&零售线: 焦点科技、孩子王,华凯易佰、吉宏股份、值得买、阿里巴巴、京东集团。
5. 影视及粉丝经济线,1)影视版权+网红艺人经纪: ①动漫影视IP线,上海电影、奥飞娱乐、光线传媒、百纳千成、中国电影、万达电影、文投控股等。②艺人经纪+影视版权线,华策影视、欢瑞世纪、光线传媒、华谊兄弟、唐德影视、慈文传媒、捷成股份、博纳影业、北京文化、横店影视、中广天择等; 2)场景承接线: 掌阅科技、中文在线、盛天网络; 3)网红+直播电商+名人素材+数字人线: 遥望科技、天娱数科、捷成股份、天地在线等
6. 广告营销线: 蓝色光标、浙文互联、天下秀、三人行、利欧股份、引力传媒、易点天下、省广集团等。