自然语言处理nlp开源项目 (自然语言处理nlp模型)

今天阅读的是李开复和一位科幻小说家陈楸帆写的《AI未来进行式》,他俩通过科幻故事的方式为我们展现了AI为了发展对我们生活影响的几种可能性,阅读非常顺畅,下面是我的阅读转述笔记。希望得到你的指导。

nlp自然语言处理技术,自然语言处理nlp开源项目

0.【故事概述】《AI未来进行式》03双雀

第三个科幻故事发生在韩国,在AI辅助的高度定制化教育的未来,一对在孤儿院生活双胞胎男孩分别被领养。

一个家庭认为知子莫若AI,没有任何一对父母能够比AI更了解自己的孩子,不管在哪个层面。(注:我不敢说自己了解自己的孩子,甚至我不敢说去曾去努力了解过自己的孩子。)

另一个家庭认为这完全是本末倒置,让算法凌驾于人之上,那孩子只能被训练成过度竞争的机器。(注:我虽然嘴上说,我没有,但我正在做。)

对抗:一个孩子,在这种外力的影响下,个人的人上的价值和意义(也就是个人信仰系统)与内心的渴望发生了冲突,为了战胜AI产生了迷茫。

成长:一个孩子,在保持内心不受污染影响的情况下,小心的触碰着外界,不断的扩大这接触面积、接触范围,在这个过程中、在AI的辅助下爆发了惊人的创造力。

AI塑造了我们,我们反过来也塑造了AI。如果我们把两口井打通,就能看到更大的世界。也许一切就会不一样。

1.AI一个正在成长的婴儿,不,青年吧

①训练AI的目的,是真正实现人机之间的有效信息交流。

我们这个社会上有两种语言。

一种是自然语言,就是我们人与人之间交流的语言,比如,在不同的环境下、不同的心情下,我们不同的面部表情下,一句话的理解会有很多歧义,这也是为什么要重视管理上的沟通,因为这种自然语言中包含了太多的所谓的噪音;

另一种是科学语言,包括所有写下的文字,比如说明书,方案等等。一个合格的科学语言是无歧义的、有逻辑的、可推导的。所以这也是为什么要重视写作的原因,能写出来的思考更容易让他人理解。

而训练AI的目的,是让它可以理解人类的自然语言,这样才能真正实现人机之间的有效信息交流。

②自然语言处理(NLP)

为了训练AI能与人类进行沟通,这就引出了另一个概念“自然语言处理(NPL)”,在技术的发展上产生了两个方向:

一个是有监督的自然语言处理

指的是同时提供输入数据和对应答案来训练AI的自然语言处理(NLP)能力,这其实就是我们第二篇笔记《深度伪造》里提到的生成式对抗网络训练的方式。

这样的数据比如多语言翻译的《圣经》(圣经也是学习任何外语的一个好的教材,因为每个语种的翻译都经过多人的修正以求尽量遵循原著)

自然语言处理(NLP),包括自然语言的识别、自然语言的理解。也就是说首先要能识别说了什么,其次要理解他真正的意图。

比如,我要上午8:38从北京起飞,上午11:10落地上海。对这句话,识别是知道这个人要什么时间干什么,而理解是需要确定是否需要帮助他定飞机票,他喜欢坐哪个航班的飞机,落地上海后需要如何到达。简单说理解就是找一个好的秘书。

因为有监督的自然语言处理需要提高承兑的数据和答案,所以就催生了人工标注的工作岗位。

比如:【预订飞机航班】我想要上午8:38【起飞时间】从北京【出发地】起飞,上午11:10【抵达时间】落地上海【目的地】。

上面【】里的内容需要人工进行标注,这个工作量是巨大的,反而限制了有监督的自然语言处理的发展。

另一个是自监督的自然语言处理 (这也是现在的发展方向)

与有监督的区别就是,训练时不需要人工标注输入、输出数据,从而打破制约训练的瓶颈。

这种NLP模型在学习语言时所依靠的不是人类语言学理论中的词形变化规律和语法规律,而是依靠AI自创的结构和抽象概念,从数据中汲取知识,然后将其嵌入一个巨大的神经网络。

我们现在熟悉的GPT就是属于这一类,李笑来写了一个文章《ChatGPT在做什么…以及它为何发挥作用》详细的介绍了这种处理方法。

简单说,它不看字面文字,而是根据一个字串去寻找在某种意义上“意义相符”的东西,输出的是一个可能出现在后面的词的排序列表,以及“概率”。问题是,最终它输出的并不一定是概率最高的那个词。

通过这样的训练,未来AI或者现在的GPT就像一个人类的幼儿在不断的试错中学会了语言、文学、数学、物理……

就目前而言,我不知道现在的ChatGPT4.0是否还具有书中写到问题(大概率会)

人类能够清楚地了解自己知道什么、不知道什么,但GPT-3却不具备这种自我认知的能力,这个漏洞会导致它有传播虚假信息的可能性。而且,GPT-3在抽象概念、因果推理、解释性陈述、理解常识以及(有意识的)创造力等方面的能力也很弱。

2.未来:个性化的AI伙伴

这个故事中,双胞胎都有一个为其定制的AI伙伴,它拥有双胞胎所有的历史数据,并且它还在陪着孩子一同成长,机器人的成长。

一个AI知道其中一个孩子喜欢赢的感觉,就不断的训练他,不断提高各种对垒的难度,这个AI更像一个教练。孩子得到了成长,但最后,在这场追逐赢的无休止的游戏中,孩子迷茫了。

那这个AI是为孩子好吗?

另一个AI小心呵护另外一个孩子的需求,不断陪伴,成为孩子艺术意识的外延工具,或共创工具,但这个孩子在成长的过程中也有迷茫。

这个AI伙伴做的全对吗?

什么样的才能成为人类的AI伙伴?

作为充满各种认知偏见的人类,我们能控制它们吗,还是被它们控制。

如果未来的AI通过了图灵测试,它是“人类”吗,我们之间的关系?

3.AI对教育领域的改变

①对孩子

就像书中说的,AI可以为孩子提高个性化的陪伴,这是现在这种流水线式的教育无法达到的。

作为家长,我们都曾经历过,孩子不断问你为什么的过程,从第一个问题回答,第二个问题回答,第三、第四个问题,我们会对孩子说“闭嘴”。

而AI不会,它会不断精准的回答孩子的问题,一层一层打下去,它会马上给他现象、给他概念、给他例子、给他测试……

孩子会在这个过程中找到自己的人生意义,慢慢形成自己的个人信仰。

②对老师

老师现在的备课方式、教授方式一定会被颠覆。AI的成长会对老师的知识结构提出更高的要求。需要老师深入挖掘学生的潜能,充分关注学生的梦想,成为学生成长之路上的灯塔。

如果还是现在这种应试教育,那只需要AI存在就行了,老师们可以下岗了。