在看科幻电影的时候,经常能看到人与各种机器人进行自然对话,就像完全是两个人在对话一样,甚至人工智能主导的机器人有着自己的意识,要取代人类,成为这个星球的主宰。放在稍早一点的时间,也许大多数人都会一笑了之,怎么可能!但OpenAI公司在2022年11月发布ChatGPT,并迅速在2023年1月底达到1亿用户后,引起了全世界的广泛关注。乐观者认为这是人类社会又一次工业革命的开始,将推动人类文明向着更高级的方向前进。悲观主义者和阴谋论者则充满了担忧,机器人统治人类的序幕已经拉开。

那么,ChatGPT到底是什么,对我们生活、工作和学习都带来了哪些影响?说ChatGPT的发布是一场AI革命,为什么?作为普通人,未来是否真的会离不开AI,甚至不知不觉中我们所做的绝大多数决定,实际上已被AI所左右。
由华龄出版社2023年2月1日出版的《ChatGPT:AI革命》,正是在这场新的工业革命开启时,带领读者全面了解这款集人工智能之大成的工具。接下来,我会从以下三个方面,通过《ChatGPT:AI革命》和你一起进入OpenAI的精彩世界。
1.ChatGPT诞生历程
2.ChatGPT技术核心及其在日常工作、生活和学习中的应用。
3.AIGC可能带来的伦理、法律及道德风险。
ChatGPT诞生历程
我们在各大主流电商平台购物时,经常会因各种问题找客服,为了提供即时服务,平台商家一般都会使用平台提供的机器人自动回复功能。然而,这些功能却总是让人找不到北,甚至答非所问。
之所以这些机器人如此不智能,是因为存在着当前技术无法克服的缺点——不能很好理解语境,且回复语句生成能力有限,只能以关键词为触发,回复人工预先设置好的内容。
随着技术的发展,人工智能进入了全面的爆发期。当先进的人工智能和机器人聊天结合在一起的时候,ChatGPT诞生了。

ChatGPT是2015年成立的OpenAI公司的三大产品之一。OpenAI公司你可能不一定熟悉,但以下两个名字你一定听过:埃隆·马斯克、比尔·盖茨。
SpaceX的创始人,Hyperloop的提出者马斯克,是OpenAI早期重要的投资人之一。虽然2018年退出OpenAI董事会和股东身份,但目前仍通过他的私人基金会等方式继续为OpenAI提供支持。
微软则是在2019年向OpenAI投资了一笔数额未公开的奖金(据说是30亿美元),在2023年2月再次投资100亿美元。在首次投资时,即与OpenAI签署了合作协议,目的是加速OpenAI的研究进展,增强微软在人工智能领域的实力,并获得OpenAI关于人工智能的最新研究成果,以便应用到微软的产品和服务中。
总的来说,OpenAI是由N多知名技术大佬共同投资或参与创建的,开发的技术主要集中在自然语言处理、机器学习、计算机视觉、机器人控制、深度强化学习等领域。2018年,OpenAI公司发布了GPT-1,它是一种大规模预训练语言模型,在各种自然语言处理任务上拥有出色的性能。到GPT-3时,已能有效建立用户提供的输入和期望输出之间的关系,从而实现自动化文本生成。
ChatGPT技术核心及应用
ChatGPT可以被视为一个革命性的聊天机器人,核心技术是基于人工神经网络的自然语言处理技术。具体来说,就是使用了一个名为GPT(Generative Pretrained Transformer)的大型深度学习模型。那什么是神经网络呢,什么是深度学习,GPT又是怎么学习的呢?

神经网络(Neural Network)是模拟生物神经系统组织结构建立起来的一种计算模型。它有多层结构,每层有多个节点(类似于神经元),通过节点之间的连接控制信号的流动。神经网络可以通过学习来自动识别模式和进行预测,在人工智能领域中得到了广泛的应用。
深度学习其实是在统计学基础上发展起来的一种机器学习形式,它可以根据已有的大量数据来自动分析和学习,生成有效的结果。与传统机器学习方法不同,深度学习是将数据进行深层次分析处理,以达到更智能、自动化、更准确的计算方法。深度学习的典型代表,就是我们常用的百度、谷歌这样大型的搜索引擎。
ChatGPT就是通过对大规模的语料库进行无监督的深度预训练和学习,自己发现并总结文本中的模式和规律,从而学习到自然语言的语义和语法规则。例如,在预训练过程中,模型接收文本序列并预测下一个单词的概率分布,然后使用这些预测来更新模型的权重。训练完成后,GPT模型就能理解用户输入的文本内容,并根据自己掌握的规则自动生成接下来的文本内容,与用户进行自然、连贯且具有逻辑性的对话。

换个更好理解的说法,就像婴儿时期的我们,学说话就是在不断模仿周围的人,刚开始是只能听,尽管不理解大家在说什么。通过长时间的观察,再通过简单的词汇和语句的输出,只要出错大人就会帮我们纠正。如此反复学习,才终于学会和别人正确的交流,ChatGPT的深度学习不正是这么一个过程吗。不同的是,人的婴儿时期学习语言一般都只是自己的母语,而GPT则是基于语料库进行多种语言的同时学习。
ChatGPT的特点是进行智能回复时,能够迅速从其拥有的大规模语料库中找到最合适的答案。它还添加了独特的转义功能,使用户能够轻松对对话进行深度调整,从而解决传统自然语言处理系统输出答案无法满足要求的问题。也就是说,当我们提出的问题,ChatGPT的回答让人不满意,我们可以告诉ChatGPT哪里不对,ChatGPT接收到指令后会根据新的要求输出修改后的结果,但不会修改掉那些正确的部分。而传统的机器人,则会认为所有输出结果都是错的,从而全部从新生成所有结果。

ChatGPT作为一款变革性的工具,必然会渗透到我们日常生活、工作和学习中的方方面面。作者在书中详细列举了ChatGPT 10大商业化落地场景,包括打造创新创业新风口、搜索引擎、创作、教育、医疗、营销、办公等。当前能让大多数普通人感受得到的,应该是ChatGPT+搜索引擎的应用了,下面我们就看看ChatGPT+搜索引擎是如何让我们获得最理想的结果的。
在集成了ChatGPT的微软Edge浏览器对话框中输入“我需要准备春节家宴,请推荐一些有吉祥寓意的菜肴”。搜索完成后,Edge会把搜索结果分成两个部分,左边是传统的网页搜索结果,右边则是ChatGPT给出的回复,如下图。ChatGPT给出的回复中还注明了信息来源。

用户还可以点击结果底部的“查看更多”,再单击“我们聊天吧”进行对话式搜索,然后就可以就当前话题继续进行交流了。

可以看到,有了ChatGPT的加持,新版必应的搜索结果更加的智能和人性化。
另一个对我们普通上班族在提高工作效率上有帮助的是,ChatGPT在AIGC中起到的作用。
AIGC(AI Generated Content)指的使用人工智能技术生成的内容,包括文字、图像、视频等多种形式。通过机器学习、深度学习等技术,AI系统可以学习和模仿人类的创作风格和思维模式,自动生成大量高质量的内容。例如计算机程序代码、写小说、广告文案、生成音乐、图片、动画、各行业的视频等等。

前面说了,ChatGPT的特点是能够迅速从其拥有的大规模语料库中找到最合适的答案,进行智能回复。在回复的过程中,还可以根据用户的要求,不断修正,从而大大减轻人们的工作量。
举个例子,现在要制作一部在太空激战的科幻片,以目前的技术,需要投入大量的时间进行建模、渲染等,不仅要求想象力足够丰富,各种技术人员还要有很强的能力。而在未来,在ChatGPT加持下的AIGC面前,一个想象力丰富的小学生,只要能把场景描述得足够细致,系统就会想要的视频生成给你。 同样,如果你想要对某个部分或细节进行修改,详细描述你的要求即可。如此多次反复,一条高质量的太空激战科幻片就制作完成了。放在今天,谁也无法想象,这样一个大师级的作品竟然是一位小学生加一台电脑完成的。
正如作者所说,ChatGPT对于AIGC来说具有重要的革新性优势,有助于加速AIGC的发展、丰富AIGC的应用场景、提高AIGC的应用效果。

最后,来说说AIGC背后的伦理、道理与法律隐忧。
任何事物都具有两面性,AIGC在大大提升生活便捷性、学习和工作效率的同时,也带来了诸多的道德和法律层面的挑战。作者提出了5大问题。
1.AI生成的内容算抄袭吗?
以ChatGPT为例,我们都知道它给出的所有回答都是由AI基于现有数据内容,根据用户提示或者要求得出,既不是用户自己完全撰写,也不是ChatGPT完全抄袭而来,而是原始训练数据的某种组合。也就是说,当你要ChatGPT协助你完成一篇文章时,ChatGPT提交给你的资料,是基于数据库里的数据,如果这些数据是有版权保护的,你算不算抄袭,要不要赔偿?
2.利用AI生成论文算不算学术不端?
目前还没有法规层面上的规定,但人们的似乎已有一定的共识。例如,《科学》不接受使用ChatGPT生成的投稿论文,同时不允许ChatGPT作为论文的合著者。《细胞》和《柳叶刀》则表示论文作者不能使用AI工具取代自己完成关键性任务,并且必须在论文中详细解释是如何使用这些工具的。

3.AIGC的知识产权归谁?
OpenAI公司在条款里的说明是,如果用户遵守了使用条款,那么ChatGPT所生成内容的相关知识产权就属于用户,用户要对内容负责,包括确保不违反任何适用法律和OpenAI公司的使用条款。
4.AI生成了错误的信息需要承担责任吗?
在人类社会,内容的作者通常是第一责任人,如果故意或者疏忽大意,导致了严重的后果或恶劣的社会影响,会触犯法律法规。但AI只是一个程序,没有自主意识,因而没有承担责任的能力。因此,用户在确定使用AI生成的内容前,应该对其进行充实的评估和核实。
5.使用AI工具时如何保护信息安全?
作者的建议是,在使用AI工具时要注意保护信息安全,不要向AI工具透露个人隐私、具有商业价值的专业内容或其它涉密内容。原因是,在使用AI工具的过程中,用户的对话内容会被纳入训练数据,因而存在被泄露和滥用的风险。

写在最后
除了以上所述的主要内容,本书还向读者介绍了ChatGPT的基本使用方法和一些插件,及当前比较知名的一些AIGC工具。
神奇的是,就算《ChatGPT:AI革命》这本书本身,也是在ChatGPT的帮助下,才得以更快完成,不得不说,人工智能技术的发展已经超出大多数人的想象。本书旨在为对ChatGPT感兴趣的读者提供一份较为全面且通俗易懂的资源,让人们更好地理解人工智能技术的意义和影响,为更多普通人开启了一扇理解AI的窗户。

本文乃笔者对该书的阅读理解和笔记,如有侵权请给我留言删除