人工智能如何变成极致 (人工智能想象能力突破)

拜AlphaGo所赐,人工智能眼下真是热门极了。很多人在讨论现在的 AI 是不是又是另外一个泡沫?答案可以说是,也可以说不是。

其实应该说普罗大众对 AI 的想象是类似科幻片里的 AI 但实际上我们离那个阶段还很远。

人工智能现代方法,人工智能技术能否学会

现在的深度学习也不是新东西,早期其实都叫做类神经网络,在类神经网络的训练效率被改善以前,处理影像的方法有千百种速解法或*力暴**解法,譬如通过信息处理的概念找边缘、找线、找圆、定位等等,这些方法虽然很快,但对于通用的物件侦测的效率一直都还是有很大的瓶颈没有突破。一直到了卷积网络出现,这些瓶颈才一步一步被改善。到了现在,针对不同的问题,可以使用不同的神经网络解决,不过至今仍没有万灵丹能使用一种网络就解决所有问题。

至于人工智能会不会攻击人类?就像上面说的,即使是深度学习,我们告诉机器的也只是输入数据和期望输出数据的对应而已,而这些对应就是一些预先输入好的01数值,对机器来说是毫无意义的。现在的人工智能对于理解抽象概念或从无到有理解空间的能力,其实还有非常远的距离要走。

人工智能现代方法,人工智能技术能否学会

其实三十年前,社会学家就已经在讨论人工智能对未来社会的冲击,经济学家在讨论人工智能会不会造成大量的失业,哲学家在讨论人工智能的道德问题,也有人在讨论人工智能算不算真正的智慧,电脑究竟会不会思考?最后前辈迪杰斯特拉教授看不下去,出来说话了,他说,“关于电脑会不会思考的这个问题,差不多就跟潜水艇会不会游泳的问题一样重要。”此话一出,让计算机学界的人乐坏了。

自古以来就是这样,真正懂的人默默做研究,忙着在寻找科技上的突破;而一些一知半解又爱出风头的人,总是会抢到话语权,提出一些虚无飘渺,又似是而非的议题迷惑大众。那些爱故弄玄虚的人提出一些很哲学性的假议题讨论,于是迪杰斯特拉就用很哲学性的话回应。

那这一波的人工智能变革来势汹汹,就只是一个幻象吗?

当然不是,这一波人工智能浪潮的最大意义,是机器学习技术的普及化,让昔日遥不可及又高不可攀的技术,变得人人可上手。在十年前,机器学习是一个遥不可及的技术。任何机器学习的模型训练工作都会让电脑慢到像死机,而编写机器学习相关的程序更复杂,除了人工智能领域里的高手之外,一般人无法理解,也无法编写。但是现在GPU被广泛的使用在机器学习的训练阶段,而TensorFlow及Keras等系统,又让机器学习程序的编写变得非常容易。

人工智能现代方法,人工智能技术能否学会

要制造一部汽车很难,但是要学会开车不难。所以机器学习技术的普及化,是这一波人工智能革命的真正意义。说不定十年后,软件工程师懂机器学习技术,就跟懂关联式数据库一样稀松平常,只是基本技能的一种。

魔术不是真的魔术,只是变魔术的人让观众产生错觉,觉得他有魔法、不可思议的事情发生了;人工智能不是智慧,至少在现在这个阶段还是如此,只是开发人工智能的人让使用者产生错觉,觉得程序有智慧罢了。

但随着人工智能技术的普及,当我们对这些程序越来越熟悉,也许我们就不再觉得人工智能那么神奇,那么有智慧了,也就是人工智能真正改变这个世界的时候。

然而在当下的许多讨论中,我发现梦想与现实的鸿沟无比巨大——许多人认为大数据加上AI是万灵丹,但其实,要先经过以下层层思考,才知道它是不是真的能为你带来商业价值。

拿大数据这部分为例,首先,最重要的是,要问对问题。要先知道你想要达到什么目的,想要知道什么,才能够知道自己需要什么数据,进行什么样的分析。

接着要问:

· 你的数据怎么来?

· 你有现有可用的数据吗?

· 平常有收集数据的渠道和习惯吗?

· 不同部门之间的数据可以相容吗?

· 数据的可用性以及权限足够吗?(即使是同一公司,各部门的数据也常常未整合,要先经过非常多的沟通,才能得到所需的数据使用权限)

· 数据传得出来吗?(有些数据产生在客户的内网里,根本无法传出来)

· 没有既有数据的话,数据要从哪里来?从传感器?摄影机?人工登录?

· 这些数据的来源稳定且足够吗?会有法律的问题吗?

· 数据的获取会有误差吗?(例如摄影机的视频数据,随着安装位置的不同,准确度会有相当大的差别)

接着还得问:

· 公司的基础建设,足够支持这些数据的持续传输或是储存吗?

· 运算主机可以持续访问数据库的数据吗?

持续传输与储存的需求看似容易,但若是数据量较大,比如高分辨率视频数据,其实会是不容小觑的成本;若是无法稳定传输,则数据的误差则可能会加大。

终于确认可以得到数据,也有足够的传输频宽与储存了,接下来还需要清洗数据。

有时候,这些数据是很“脏”的,这是个两难。一开始采用大数据时的初衷,是要从尽量多的数据中找出有意义的价值,所以可能什么都先抓下来再说,但其中可能有误差或是不够精准的数据。若是数据有问题,就无法产生有价值的结论,又或是像之前几个被玩坏的聊天机器人。

另外一种“脏”是数据用语与格式的不统一,例如同样的一个“金额”的数据,可能在有些文件里叫做“金额”,有些叫做“价钱”,有些用“$”符号取代,全半角还不一样,同样的项目有不一样的称呼,都会造成分析的困难,需要进一步统一。

终于把数据收集好并洗干净了,此时才真正要开始分析数据了。此时才是讨论分析方法、算法、如何训练电脑学习、如何从这些数据中挖掘出一些模式或趋势的时候。

人工智能现代方法,人工智能技术能否学会

接着,当我们挖掘出这些趋势,它只是一个“现象”,这些现象要进一步解读,进而产生有商业价值的决策。此时,领域知识就相当重要。具有足够的领域知识,才能知道这些现象在这个行业中代表什么意义,也能判断什么样的结果是有价值的,什么样的结果是有误差的。例如我们可以利用摄影机数据,判断出商店的“热区图”——最多客人有兴趣,逗留最久的地方,结果老板一看就说,这里是休息区,这里是试鞋区,这里是结帐区,当然人待在这几个地方最久啊!一秒被打脸,这样的结果就是没有商业价值的。

若是有领域知识,非常简单的数据与趋势,就能产生非常有价值的结论了,例如非常简单的“人流计算”,计算有多少人流走进店里,有经验的客人就知道将人流计算跟结帐数据结合,转换为“提袋率”,或是将进店人流与进试衣间试穿的人流比较,推估出“试穿率”,再从结帐数据推估出“试穿后购买率”,这些简单的数据,都能产生出不简单的结论与实现方案。

人工智能现代方法,人工智能技术能否学会

当这些趋势真的有办法转换为有价值的商业策略,接下来还要能推动与执行才行。许多公司即使知道数据分析出这样的趋势,讨论出公司策略与走向的改变,但真正要推动变革,还是有困难的,更多的是反过来让数据分析的结果,为现有决策背书歌功颂德,“先射箭再画靶”,而非真正想追求改变与进步。

当你终于打通以上关卡,记得时时利用新得到的数据,检验这个改变的策略是否成功,并持续修正。反之,若是一上来就想要打大Boss,结果就是——你以为自己是亚马逊,其实是鲁宾逊,在数据之海漂流,最终被困在各种技术名词与算法的荒岛上而已。

—————————————————————————

关注公众号:“sunzhichaoshuo” 或 “孙志超说” 分享更多干货

若有问题,微信公众号点“有问就提”加入孙志超的知识星球,我会认真回答。