
昨日,腾讯宣布推出智能语音助手“腾讯叮当”,其功能与亚马逊Alexa类似,也是具备精准的前端语义识别,并能提供迅捷精准的互动反馈的人工智能助手。
相比于亚马逊在细分硬件上的嵌入,腾讯叮当似乎更希望整合一个完整的服务体系。如对着腾讯叮当说出“查询天气”,它会提供当日天气及后三天的预报。问到足球比赛结果时,叮当会在1秒内给出非常有针对性的答复。目前腾讯叮当已经涵盖新闻、赛事、票务、快递、音乐、股市、文学等七大类资源。
AI 语音领域群雄并立
人工智能作为未来科技的核心技术,各家公司都对其充满了兴趣,目前的AI助手领域,呈现出的是微软Cortana、谷歌Assistant、亚马逊Alexa和苹果Siri群雄并立的趋势。
在这些AI语音助手中,苹果的Siri普及最早,每一部iPhone都是一个Siri的“宿主”,但苹果似乎在这方面并没有太过明确的计划,仅仅在前两年推出过一次针对国内的搜索优化,让你可以实现类似地图中的周边搜索,但依然处于放任自流的状态。
对比之下,谷歌Assistant比苹果Siri则显得更聪明、更有能力,这对苹果来说是一件很尴尬的事,因为苹果Siri的起点比Assistant早五年。
谷歌Assistant之所以杰出,是因为它渗透了谷歌庞大的产品网络,并把它们整合成为一个单一的、全知的应用程序。用户使用Calendar、Photos和Gmail等谷歌服务的次数越多,Assistant就会变得越聪明。
回退到五年前,可能没人会想到给Google造成最*麻大**烦的会是亚马逊,其Alexa的成功事实上正在对Google造成根本性威胁。现在再回头看亚马逊一路采取的行动,你会发现它几乎每步都做对了:从收购三家语音公司打造Echo,再到花4~5年打造一款产品的体验而不是草草拼凑一款好像能用的产品,然后确定一个柱状的ID而不是拟人态的机器人来降低用户预期,销量一旦站到百万以上则开放后端Alexa Skills Kit以及Amazon Voice Service,再到最近的开放七麦克风阵列。几乎每一步都高度务实和正确。
日前,亚马逊创始人贝佐斯接受专访提到,Alexa已经成为亚马逊的核心战略之一,其估值可能接近百亿美元。
而Cortana作为微软最为出色的AI助手,随着Win10系统的推出也在不断普及。在前不久,微软更是推出了相关的Android手机应用,可以让安卓用户可以在锁屏界面直接呼出Cortana进行搜索或操作,而Cortana近期针对人脉和信息做的相关优化,确实不失为一名合格的“秘书型”AI助手,具有一定的竞争力。
另外,Facebook 创始人扎克伯格也在2016年自己花费 100 小时完成了 AI 管家 Jarvis 的开发。扎克伯格及家人可用语音向手机或计算机下达语音指令,实现灯光、温度、电器、音乐和安防设备的控制操作。Jarvis系统具备的学习功能可使其识别主人的偏好模式、学习新词汇与相关概念。
再看国内,巨头们也相继进入了语音交互领域。去年10月份,Intel与科大讯飞宣布合作共同研发AI芯片,此次合作正式宣告Intel也将进入智能语音交互市场。从“语音”切入,通过语音识别,到语音合成,到分析和思考,最终到人机交互,这是它的核心战略指向。目前的科大讯飞,已经成为全球第二大智能语音公司、沪深两市市值最高的软件企业,拥有3亿多用户。
2月份,百度宣布全资收购渡鸦科技,创始人吕骋携团队正式加盟百度,并出任百度智能家居硬件总经理,向百度集团总裁和首席运营官陆奇汇报。陆奇指出,凭借语音与对话技术的优势,百度在引领新一代人机交互平台上将拥有巨大的机会,自然语言和其他智能交互方式有可能出现在从手机到家居的每一个设备中。
同月,有报道称,华为在深圳有一个超过100名工程师的团队正在开发语音助手服务,开发工作目前还处于早期阶段。华为语音助手项目目标宏大,瞄准苹果Siri、亚马逊Alexa和Google Assistant。华为语音助手定位中文,面向国内用户,在海外市场将继续与谷歌和亚马逊合作。
创业公司方面, 2012年就开始专注语音人工智能领域出门问问,也在近期完成了1.8亿美元融资,其在2014年因为接入谷歌眼镜而名声大噪。
这一次,为什么是智能语音?
语音分析创业公司VoiceLabs近日发布了《2017年语音报告》。报告显示,2017年预计将有2450万台以语音为主要交互方式的智能硬件产品发货,市场总量将达到3300万台,市场规模超过200亿美元。
还有数据显示,预计到2020年,全球语音识别的市场规模将从2015年的61.9亿美元增长到200亿美元,发展空间巨大。在这场新兴市场的争夺战中,谁抢占入口,谁就占得先机。
此外,AI助手的功用万千,而且与人类的交互方式也有很多,但语音助手无疑是最为快捷方便的一种。
腾讯人工智能版图
如今各家企业的技术积累到了爆发关口,产品“百舸争流”已经是现状。不过相较百度多次在公共场合为人工智能发声,腾讯则更为低调,但这并不代表其会缺席人工智能领域。
在4月初的2017年IT领袖峰会上,马化腾曾表示,腾讯的人工智能多和社交相关,“在这方面腾讯做了很长时间的研究,其他方面还刚刚开始。”
基于业务驱动,这种布局主要表现在, 2010年9月腾讯成立了“模式识别”团队,研究方向包含语音识别、图像识别、语义理解等,其中包括微信功能的语音转文字。在图像处理上,2015年9月,腾讯云宣布将旗下顶级的图片处理技术——优图开放给业界。
目前,腾讯的基础研究基地分散全国各地,其中有四大秘研基地,主要包括香港WHATLAB、上海&合肥优图实验室、北京微信模式识别中心、智能计算与搜索实验室。
晚于百度深度学习研究院三年,2016年腾讯也成立了人工智能实验室AI Lab,目前有50余位AI科学家及200多位AI应用工程师团队。值得注意的是,前百度研究院副院长张潼在3月23日宣布加入AI Lab,出任执行主任。
最近表现不凡的AI围棋团队“绝艺”就是出自该团队。马化腾介绍说绝艺和AlphaGo不同的地方是,绝艺的成长全程得到了围棋专家的指导。
实际上,在腾讯庞大的投资并购单中,针对AI类初创也有较小篇幅的投资,曾披露过的项目有湾区的数据公司Diffbot、健康医疗领域的碳云智能和CloudMedx、云计算服务商ScaledInference、开源公司Skymind等。项目偏向海外地区,投资轮次多以天使、A轮早期为主。