鹦鹉学舌泄露秘密 (鹦鹉学舌被坑)

聚焦信息技术领域为产业发声

导读

据英国《太阳报》9月20日报道，近日，一只鹦鹉居然通过模仿主人的声音在亚马逊官网上成功下单，《太阳报》网站上的一段视频显示，鹦鹉叫了声“亚历克萨”，然后扬声器开始亮起蓝灯，表示它正在听从用户的需求。巴迪随后胡言乱语一番，机器回复到：“你想订什么呢？”当时主人并没有把这事太放在心上，直到她收到一份订单显示，已经订购了一些金色的礼品盒。对此，主人表示不可思议。“鹦鹉学舌”到底是如何欺骗智能音箱，从而购物成功的呢？

智能音箱的“辨人”秘诀

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

据了解，“亚马逊回声”是一款语音控制智能音箱，内置亚马逊开发的“亚历克萨”语音助理功能。用户通过向“亚历克萨”发出命令来访问一系列服务，比如实现智能家居控制、语音购物、音频音乐*放播**等功能。用户不用扫描二维码，不用输入密码，就能购物，极大地提高了用户体验感，此外，它还能够根据声音条件识别出不同的使用者，以此保证使用的安全性和私密性。而这一切全都依赖于“声纹识别”功能。

与语音识别不同，声纹识别的目的不是识别语音的内容，而是识别说话人的身份。每个人的说话特性都具有其独特的特征，而决定这种独特特征的因素有：声腔的差异，比如咽喉、鼻腔、口腔这些器官的形状、尺寸和位置，另一个是发声的操作方式，主要是指唇、口齿、舌头等部位在发声时的相互作用。这些因素导致不同的人说话，其声音不同，而这些不同正成为智能音箱识别不同人的基础。

智能音箱是如何“辨人”的

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

声纹识别有两类，即说话人辨认和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的，是“多选一”问题；而后者用以确认某段语音是否是指定的某个人所说的，是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术，如缩小刑侦范围时可能需要辨认技术，而银行交易时则需要确认技术。不管是辨认还是确认，都需要先对说话人的声纹进行建模，在此事件中，鹦鹉学习主人说话，智能音箱识别出来，属于说话人辨认。

根据百度工程师曾在参加综艺节目《最强大脑》时的介绍，一个基本的声纹识别过程主要包括声纹注册和声纹测试阶段：在声纹注册阶段，每个可能的用户都会录制足够的语音然后进行说话人特征的提取，从而形成声纹模型库。这个模型库就像字典，所有可能的字都会在该字典中被收录。在声纹测试阶段，测试者会录制一定的语音，然后进行说话人特征提取，提取完成后，就会与声纹模型库中的所有注册者进行相似度计算。

声纹特征是类似于虹膜、指纹等一种具有独特性的生物特征。一般而言，人正常说话时的声纹状态是相对稳定的，但身体状况、年龄、情绪等情况的干扰，会导致声纹特性的变化。比如一个人感冒了，鼻腔堵塞从而导致声纹特性不一致，那机器可能也不能识别成功。

“鹦鹉学舌”如何骗过智能音箱

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

英国生物学家查尔斯·达尔文在书写《人类起源》时，曾思考人类是如何学会说话的，他写道“鸟类发声在好几个方面为人类语言的发展提供了最近的类比。”他认为语言可能起源于鸟鸣。人通过咽喉部的气流强弱、声带振动从而控制所发出的声音，而鹦鹉能学会人说话，秘密就在于它特殊的生理构造：鸣管和舌头。鹦鹉的舌头比其它鸟类圆滑柔软，能发出比较复杂的声音，类似人类的语言，但鹦鹉的发声器与人类的声带有所不同，鹦鹉的发声器叫鸣管，位于气管与支气管的交界处，由最下部的3~6个气管膨大变形后与其左右相邻的三对变形支气管共同构成。

当然，鹦鹉会说话只是因为条件反射，并不具备思维能力。人如果系统地发出同一句话，或是一个声音，久了它们也就能跟着模仿了。例如人们在训练一只鹦鹉时，把敲门与“请进来”二者的声音联系在一起刺激鹦鹉，鹦鹉就会把这些信号储存起来，经过反复刺激，继而形成条件反射。只要当它听到敲门声，接着就会大喊：“请进来。”有时外面在敲木板，它也会大喊：“请进来。”在此事件中，鹦鹉听到主人不断的重复购物的词汇，长此以往便学会了如何控制智能音箱。看来，以后要让鹦鹉“不败家”，还要背着鹦鹉购物才行......

声明：

黄河连线系太原九州连线文化传媒有限公司旗下品牌

本平台法律顾问为山西晋商律师事务所

黄河连线原创文章，转载请注明出处

往期文章阅读：

木兰观察丨赵鹏：就业应“去标签化”

木兰观察丨山西应如何发展大数据与智慧城市？

木兰观察丨“破门而入”的医疗大数据将如何改变你我的生活？