鹦鹉学舌泄露秘密 (鹦鹉学舌被坑)

聚焦信息技术领域 为产业发声

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

导读

据英国《太阳报》9月20日报道,近日,一只鹦鹉居然通过模仿主人的声音在亚马逊官网上成功下单,《太阳报》网站上的一段视频显示,鹦鹉叫了声“亚历克萨”,然后扬声器开始亮起蓝灯,表示它正在听从用户的需求。巴迪随后胡言乱语一番,机器回复到:“你想订什么呢?”当时主人并没有把这事太放在心上,直到她收到一份订单显示,已经订购了一些金色的礼品盒。对此,主人表示不可思议。“鹦鹉学舌”到底是如何欺骗智能音箱,从而购物成功的呢?

智能音箱的“辨人”秘诀

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

据了解,“亚马逊回声”是一款语音控制智能音箱,内置亚马逊开发的“亚历克萨”语音助理功能。用户通过向“亚历克萨”发出命令来访问一系列服务,比如实现智能家居控制、语音购物、音频音乐*放播**等功能。用户不用扫描二维码,不用输入密码,就能购物,极大地提高了用户体验感,此外,它还能够根据声音条件识别出不同的使用者,以此保证使用的安全性和私密性。而这一切全都依赖于“声纹识别”功能。

与语音识别不同,声纹识别的目的不是识别语音的内容,而是识别说话人的身份。每个人的说话特性都具有其独特的特征,而决定这种独特特征的因素有:声腔的差异,比如咽喉、鼻腔、口腔这些器官的形状、尺寸和位置,另一个是发声的操作方式,主要是指唇、口齿、舌头等部位在发声时的相互作用。这些因素导致不同的人说话,其声音不同,而这些不同正成为智能音箱识别不同人的基础。

智能音箱是如何“辨人”的

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

声纹识别有两类,即说话人辨认和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,在此事件中,鹦鹉学习主人说话,智能音箱识别出来,属于说话人辨认。

根据百度工程师曾在参加综艺节目《最强大脑》时的介绍,一个基本的声纹识别过程主要包括声纹注册和声纹测试阶段:在声纹注册阶段,每个可能的用户都会录制足够的语音然后进行说话人特征的提取,从而形成声纹模型库。这个模型库就像字典,所有可能的字都会在该字典中被收录。在声纹测试阶段,测试者会录制一定的语音,然后进行说话人特征提取,提取完成后,就会与声纹模型库中的所有注册者进行相似度计算。

声纹特征是类似于虹膜、指纹等一种具有独特性的生物特征。一般而言,人正常说话时的声纹状态是相对稳定的,但身体状况、年龄、情绪等情况的干扰,会导致声纹特性的变化。比如一个人感冒了,鼻腔堵塞从而导致声纹特性不一致,那机器可能也不能识别成功。

“鹦鹉学舌”如何骗过智能音箱

鹦鹉学舌爆出的秘密,鹦鹉学舌被坑

英国生物学家查尔斯·达尔文在书写《人类起源》时,曾思考人类是如何学会说话的,他写道“鸟类发声在好几个方面为人类语言的发展提供了最近的类比。”他认为语言可能起源于鸟鸣。人通过咽喉部的气流强弱、声带振动从而控制所发出的声音,而鹦鹉能学会人说话,秘密就在于它特殊的生理构造:鸣管和舌头。鹦鹉的舌头比其它鸟类圆滑柔软,能发出比较复杂的声音,类似人类的语言,但鹦鹉的发声器与人类的声带有所不同,鹦鹉的发声器叫鸣管,位于气管与支气管的交界处,由最下部的3~6个气管膨大变形后与其左右相邻的三对变形支气管共同构成。

当然,鹦鹉会说话只是因为条件反射,并不具备思维能力。人如果系统地发出同一句话,或是一个声音,久了它们也就能跟着模仿了。例如人们在训练一只鹦鹉时,把敲门与“请进来”二者的声音联系在一起刺激鹦鹉,鹦鹉就会把这些信号储存起来,经过反复刺激,继而形成条件反射。只要当它听到敲门声,接着就会大喊:“请进来。”有时外面在敲木板,它也会大喊:“请进来。”在此事件中,鹦鹉听到主人不断的重复购物的词汇,长此以往便学会了如何控制智能音箱。看来,以后要让鹦鹉“不败家”,还要背着鹦鹉购物才行......

声明:

黄河连线系太原九州连线文化传媒有限公司旗下品牌

本平台法律顾问为山西晋商律师事务所

黄河连线原创文章,转载请注明出处

往期文章阅读:

木兰观察丨赵鹏:就业应“去标签化”

木兰观察丨山西应如何发展大数据与智慧城市?

木兰观察丨“破门而入”的医疗大数据将如何改变你我的生活?