
第三期(下)
巨头在智能音箱的布局
1、叮咚,国内先行者
在2016年5月的首届亚洲消费电子展上,京东智能与科大讯飞联手推出了叮咚智能音箱。这款产品通过嵌入科大讯飞语音技术和全志R16物联网解决方案,凭借人工智能处理,可以成为用户的音频助理,完成京东购物、百科查询、讲故事、聊天等功能。同时,该产品可以让用户通过语音控制接入京东微联的智能产品,成为京东AI家庭终端系统的交互入口。

叮咚智能音箱在价格、本地化服务以及细分场景等多方面享有优势。通过不断迭代和产品线丰富,共推出了旗舰版A1、青春版Q1、悦动版Q3、儿童教育版A15等多个版本。在设计和功能方面进行了持续升级创新,给用户更多个性化的推荐和服务。此外京东在生态体系建设上的实力和自身的销售渠道都将使叮咚智能音箱受益。

叮咚的销售和使用体验数据反应了中国用户语音交互的使用习惯正在和欧美接近。
截止2017年2月,产品的整体销售同比增长137%,以2016年双11当日为例,叮咚智能音箱在京东平台上智能音箱品类里销量排名第一,并且大于第二名和第十名的销量之和。从功能使用频率上看,点歌功能的使用频率达到了53%,其余如闲聊、查询周边生活服务、控制家居、搜索电台、广播等功能也是用户热衷的功能。在AI家庭终端控制方面,用户使用叮咚控制家电频率最高的前五名品类分别是:插座、窗帘、加湿器、灯、空调。
科大讯飞作为国内智能语音产业领导者,实行全产业链发展战略,从上游的语音硬件芯片、麦克风阵列,到中游基础应用层的语音合成、语音识别和语音拓展等技术,再到下游的服务方案和产品均有完整布局。除了和京东合作推出的叮咚外,公司已经与JBL 等多家知名音箱品牌厂商推出合作产品,并正式启动开放平台战略,与京东JIMI 智能客服、中通快递、e 袋洗、有道云笔记、百度地图、得到、中国天气通、万年历等企业实现合作,满足家庭场景下生活服务多样化需求,共同打造智能语音的家庭服务入口。
2、Microsoft,不甘落后
2014年5月,微软首次发布人工智能伴侣虚拟机器人“微软小冰”,经过两年的技术改进与调试,*四代第**微软小冰于2016年8月5日发布。2016年12月9日,微软(亚洲)互联网工程院宣布与腾讯达成合作,小冰进入腾讯QQ,让手机QQ聊天功能“厘米秀”拥有智能沟通的能力,与QQ平台上获得首批AI体验资格的用户进行智能互动。3月14日,合作又进一步深入,小冰可被用户邀请至QQ群聊。小冰拥有实时情感决策对话引擎,可以与群用户进行实时对话,支持语音和图像多感官交流。除聊天功能外,QQ群聊小冰还开放了测天气、猜成语、占星术、对诗等群游戏和群管理技能。
“微软小娜”语音助手或成微软合作企业首选。2014年7月,微软召开Windows Phone 8.1 Update中国区发布会,正式发布Cortana中文版“微软小娜”。在过去几十年里,微软一直是企业软件的主要提供商。日产和大众等公司将微软技术嵌入自己生产的汽车中,如日产将微软语音助手Cortana嵌入了下一代汽车的仪表板。同时,Harman Kardon宣布在2017年推出集成Cortana语音助手的智能音箱,与亚马逊Echo、Google Home在智能音箱市场展开角逐。在2017年Build开发者上,微软与哈曼卡顿联手推出了加入微软人工智能语音助手Cortana的智能音箱Invoke。用户可以通过语音直接向这款智能音箱的语音助手Cortana下达命令,可以完成控制音乐*放播**、控制家中的照明强弱等功能。与Echo及GoogleHome相比较来说,Invoke最大的亮点功能就是能够继承Skype互联网电话服务,随时进行语音会议。
3、其他参与者
除此之外,百度、腾讯、三星、阿里等各大巨头也在积极介入智能音箱市场。
01
Nuance
Nuance是专注语音识别底层技术巨头之一。2012年,Nuance从底层语音技术输出商转型为企业解决方案服务商,成立四大业务部门,包括医疗业务部、企业业务部、移动设备业务部和图像业务部。凭借多年在银行、医疗、汽车等行业的服务经验,Nuance开始布局语音AI领域,试图率先建立行业壁垒。

2015年末,Nuance推出专门针对移动和消费电子产品的开发平台Nuance Mix。Nuance Mix可以帮助设备制造商和开发人员快速创建自定义语音和自然语言处理接口,加速包括智能家居、游戏、机器人等行业在内的发展。同时,Nuance Mix可以作为中间件对智能手机和物联网产品实施控制,并直接与设备本身交互。2017年1月,在国际消费电子展上,Nuance通过融合Nuance Mix平台的Greenwave Systems AXON Platform、家居安全系统集成、ROOBO Jelly OS等实现了对话型智能家居系统。现场有将物联网的连接范围延伸到互联汽车中的演示。
02
百度
百度作为BAT中最早进军人工智能的互联网公司,已将AI作为未来最重要的核心战略,先后成立深度学习研究院(Institute of Deep Learning,IDL)、硅谷人工智能实验室、百度北美研究中心、AI技术平台体系(AIG)等。
2010年,百度已经开始进行智能语音技术研发,并于同年10月推出语音搜索服务。2014年末,在百度任职的吴恩达团队发明了“Deep Speech”语音识别系统,可以在嘈杂环境下实现将近81%的辨识准确率。该系统采用深度学习算法取代了原有模型,在递归神经网络或者模拟神经元阵列中进行训练,让语音识别系统更加简单。2015年11月,百度推出Deep Speech 2.0深度语言识别技术,用于提高在嘈杂环境下语音识别的准确率。2016年,百度公布深层卷积神经网络技术Deep CNN算法模型,此模型有望成为Deep Speech 3.0核心组成部分,并率先应用到百度语音搜索中。
2015年9月,百度发布声控人工智能个人助理“度秘”,在广泛索引服务信息的基础上,依托百度智能交互技术,为用户提供优质服务。2015年12月,度秘与华为荣耀“精灵键”深度集成,为华为手机用户提供秘书化服务。目前,度秘可以在餐饮、电影、宠物等场景提供秘书化服务,还将延伸到代驾、教育、医疗、金融等行业中。2016年11月22日,百度宣布在其语音开放平台上线三周年之际,将四项技术免费开放给用户和开发者共享,包括情感合成、远场方案、唤醒二次技术和长语音方案。

2017年2月百度宣布收购智能音箱领域有布局的渡鸦科技。
03
腾讯
2015年8月,腾讯设立TICS(智能计算和搜索)实验室,专注搜索、自然语言处理、数据挖掘和人工智能等方面。2015年11月,成立WHAT实验室,即微信—香港科技大学人工智能联合实验室。2016年4月,腾讯成立AI实验室,基于业务整合目标研究计算机视觉、语音识别、自然语言处理和机器学习等研究领域,和内容AI、社交AI、游戏AI、工具类AI 等研究方向。
微信的语音文字转换、声纹识别等功能初具语音AI能力。2016年5月,腾讯云联合微信AI团队正式上线智能语音服务,全面进入语音AI领域。在语音识别、语音合成、声纹识别等功能上,腾讯云为行业提供了一款垂直领域定制化的语音产品,其专业高效的语音大脑,满足了用户多样场景需求。通过亿万级别业务的并发验证,腾讯云智能语音识别技术在通用领域中准确率达95%,并可基于不同领域的行业属性,为其定制化语音识别模型,快速解决各项业务难题。

04
IBM
IBM自2006年开始研发Watson,并在《危险地带》智力抢答游戏中一战成名。在后期Watson逐步转型为认知商业计算平台,并应用于医疗、金融等领域。2014年1月,IBM宣布组建“WatsonGroup”,旨在进一步开发、商用及增强Watson及其他认知技术。
2016年3月,IBM与科大讯飞正式建立战略合作,致力于在认知计算算法、云平台架构等层面合作。2017年3月,IBM宣布在语音识别领域取得重大进展:Watson的语音识别系统错词率降至5.5%。
05
Intel
2016年10月,Intel与科大讯飞宣布合作共同研发AI芯片,该芯片将麦克风阵列、远场语音识别等功能集成到SoC当中,形成完整的远场语音交互链条,面对来自国内初创公司技术的压力,此举进一步增强科大讯飞在麦克风阵列技术和方案方面实力,摆脱国内合作ARM厂商的技术限制,同时自身也进入智能语音交互市场提供底层硬件。
07
阿里巴巴
2015年7月,阿里发布人工智能购物助理虚拟机器人“阿里小蜜”。2015年双十一期间,蚂蚁金服95%的远程客户服务已经由大数据智能机器人完成,并同时实现了100%的自动语音识别。2016年8月,阿里云宣布推出人工智能系统—ET。ET基于阿里云强大的计算能力,正在向多个领域不断进化,目前已具备智能语音交互、图像/视频识别、交通预测、情感分析等技能。
07
2013年8月,收购语音识别及机器翻译公司Mobile Technologies,帮助公司从图片识别拓展到语音识别领域。2015年1月收购语音指令创业公司Wit.AI,帮助Messenger创建语音输入模式。2017年3月宣布为旗下Oculus Rift VR眼睛和三星Gear VR眼睛增加语音搜索功能。
08
三星
2016年1月,收购Siri之父创建的语音助手系统Viv公司,以80亿美元收购全球领先的音箱产品制造商哈曼国际,联合英伟达投资Sound Hound,完善语音交互产业布局。
4、行业参与者分类
研究各大具有代表性的智能音箱产品和智能语音类AI产品后可以看出,最有动力参与智能音箱产品推动的都是背靠大平台优势的巨头型企业。原因在于智能音箱只是AI家庭终端的一个突破口,其背后真正的较量是如语音交互等AI技术和所依靠的平台生态,这些对于初创企业而言都是跨不过去的阻碍。
细分来看厂商主要有两类。
1) 一类是本身已经有了优势的硬件产品,希望凭借积累,增加智能音箱这一品类,布局家庭场景的企业。
2) 另一类是本身不具备优势硬件产品,希望通过智能音箱来抢占家庭数据接口,颠覆现有格局的企业。
第一类企业的代表是苹果公司。苹果公司通过平板、智能电视、智能机顶盒等多种载体多次尝试打入家庭智能平台,最终都没成功。在亚马逊和谷歌在智能音箱上都有所成就后,才不得不选择快速跟上。
第二类企业的代表是亚马逊。亚马逊在硬件上的尝试都显得不太成功,例如Firephone、FireHD等。所以,其有很强的动力希望在下一代硬件接口上率先落地。
