火爆全球的文心一言以及备受关注的文心一言,引发了人们对于人工智能的新一轮热议。作为大模型产品,它们习得了人类的语言规律,能够聪明地回答很多问题。除了与人类对话,AI模型还在生产线质检、作物病害识别等工农业场景中发挥越来越重要的作用。
那么究竟什么是AI模型呢?AI模型是指基于已有的数据集运行深度学习算法所得到的输出。可简单理解为计算机在大量数据中学到的技能。这项技能本身也是一种算法,就如同专业运动员在比赛前需要接受长期系统的训练。
一个AI模型在投入使用前同样也要经历训练,只不过这种训练是通过持续给机器喂数据,并优化框架算法,匹配相应算力来达成。

但是正如我们不能期待梅西去打NBA、马龙去踢世界杯,一个用于火灾监测预警的AI模型也没法应用于超市商品结算。
那是不是我们想要解决100个问题就要从头训练100个AI模型呢?要知道训练一个AI模型技术复杂度并不比训练一个国家队运动员低。这便难倒了许多想要使用AI模型的企业。在铁肩担道义的领先AI企业们想到了一个妙招,那就是使用更庞大的数据集,更先进的无监督学习算法和更大规模的算力对模型进行预训练,使模型具备更大的参数量成为既能打NBA。

有问题世界杯甚至可以参加世兵赛的全能球员。在面对具体问题时,只需要根据特定领域的数据进行微调就能投入使用,从而向传统模型通用性差、开发应用门槛高,这两大难题说拜拜。这样的模型叫做大规模预训练模型,简称大模型。
常见的AI大模型有:NLP自然语言处理大模型、CV计算机视觉大模型、跨模态大模型和科学计算大模型。NLP自然语言处理大模型具备超强语言理解能力以及对话生成、文学创作等能力,广泛应用于医疗金融对话。搜索信息抽取跨语言、代码图网络等场景。比如ChatGPT、百度文心一言,就都是这类大模型产品。

·CV计算机视觉大模型,可以广泛应用于对海量商品图片进行识别。跨模态大模型,可实现横跨文字、图像等多模态数据的搜索,以及用文本生成图像和视频。比如越来越被人熟知的AI作画,靠的就是这类大模型。
科学计算大模型,可以帮助科学家,更高效地从海量数据中发现规律,大幅提高科研效率。比如生物计算大模型,可以更好地帮助研究人员,进行蛋白质结构预测,并在疫苗设计、新药研发、精准医疗等方面,发挥越来越重要的作用。

了解了大模型,那我们所说的知识增强大模型,又是什么呢?融合了知识图谱的大模型,就是知识增强大模型。知识图谱是由大量相互关联的知识点,构成的知识网络。当机器看到一个知识点的时候,也同时知道了跟它有关联的知识点。就像人在读到一个词时,也会联想到同义词,以及与这个词有关的其他词。
有了大规模知识图谱,机器就相当于有了人类的知识传承,可以从海量数据和大规模知识中融合学习,学习的效率和效果都有很大的提升。知识增强大模型对人类的语言表达,具有更强的理解能力。
举个例子,如果我们想找一张嫦娥降落月球的图片,那对于机器来说最大的难点就是:嫦娥是她,还是她。想要解决这个问题,机器就会进一步把降落这两个字,关联到探测器上,那就可以确定这句话是指嫦娥探测器降落在月球,而不是传说中的嫦娥奔月。

学术界普遍具有一个共识,即模型规模越大,运算精度越高,实际效果越好。因此,全球AI企业也开启了对于大模型的军备竞赛,2018年的GPT预训练模型,参数量突破了1亿,到2020年的GPT-3模型,参数量就已经达到1750亿。

而2021年百度联合鹏城实验室发布的鹏城-百度·文心大模型,模型参数规模更是达到2600亿。是全球首个知识增强千亿大模型。
那么问题来了,如此厉害的大模型要怎样应用到具体的行业中去?事实上,业界领先的AI企业已经和众多行业伙伴一起探索出了行之有效的大模型产业落地方式。这就是科技研发企业、技术应用企业共同把各自的优势进行整合。
技术应用企业根据自己的目标提出需求,具有算法算力的数据综合优势的企业。将模型生产的复杂过程封装起来,通过低门槛高效率的生产平台,为千行百业提供大模型服务。这样的话,大数据大算力大模型能力仅需少数企业操心,产业界就可以拥有更坚实的技术底座,更便捷的开发工具。

更全面的人工智能技术享受到开箱即用的美好体验,奔向产业的智能升级,面向未来,知识增强大模型将会持续围绕整体平台化能力,行业赋能广度和深度进行持续攻坚突破。解决大模型开发落地难、覆盖广度低、应用深度浅、生态基础薄弱等问题。将大模型变成驱动人工智能产业进一步高速发展的元能力引擎。
大模型的未来也必然和我们每一个人息息相关,帮助我们的工作更有效率,让我们的日常生活更加便利。