人工智能如何变成极致 (人工智能想象能力突破)

拜AlphaGo所赐，人工智能眼下真是热门极了。很多人在讨论现在的 AI 是不是又是另外一个泡沫？答案可以说是，也可以说不是。

其实应该说普罗大众对 AI 的想象是类似科幻片里的 AI 但实际上我们离那个阶段还很远。

人工智能现代方法,人工智能技术能否学会

现在的深度学习也不是新东西，早期其实都叫做类神经网络，在类神经网络的训练效率被改善以前，处理影像的方法有千百种速解法或*力暴**解法，譬如通过信息处理的概念找边缘、找线、找圆、定位等等，这些方法虽然很快，但对于通用的物件侦测的效率一直都还是有很大的瓶颈没有突破。一直到了卷积网络出现，这些瓶颈才一步一步被改善。到了现在，针对不同的问题，可以使用不同的神经网络解决，不过至今仍没有万灵丹能使用一种网络就解决所有问题。

至于人工智能会不会攻击人类？就像上面说的，即使是深度学习，我们告诉机器的也只是输入数据和期望输出数据的对应而已，而这些对应就是一些预先输入好的01数值，对机器来说是毫无意义的。现在的人工智能对于理解抽象概念或从无到有理解空间的能力，其实还有非常远的距离要走。

人工智能现代方法,人工智能技术能否学会

其实三十年前，社会学家就已经在讨论人工智能对未来社会的冲击，经济学家在讨论人工智能会不会造成大量的失业，哲学家在讨论人工智能的道德问题，也有人在讨论人工智能算不算真正的智慧，电脑究竟会不会思考？最后前辈迪杰斯特拉教授看不下去，出来说话了，他说，“关于电脑会不会思考的这个问题，差不多就跟潜水艇会不会游泳的问题一样重要。”此话一出，让计算机学界的人乐坏了。

自古以来就是这样，真正懂的人默默做研究，忙着在寻找科技上的突破；而一些一知半解又爱出风头的人，总是会抢到话语权，提出一些虚无飘渺，又似是而非的议题迷惑大众。那些爱故弄玄虚的人提出一些很哲学性的假议题讨论，于是迪杰斯特拉就用很哲学性的话回应。

那这一波的人工智能变革来势汹汹，就只是一个幻象吗？

当然不是，这一波人工智能浪潮的最大意义，是机器学习技术的普及化，让昔日遥不可及又高不可攀的技术，变得人人可上手。在十年前，机器学习是一个遥不可及的技术。任何机器学习的模型训练工作都会让电脑慢到像死机，而编写机器学习相关的程序更复杂，除了人工智能领域里的高手之外，一般人无法理解，也无法编写。但是现在GPU被广泛的使用在机器学习的训练阶段，而TensorFlow及Keras等系统，又让机器学习程序的编写变得非常容易。

人工智能现代方法,人工智能技术能否学会

要制造一部汽车很难，但是要学会开车不难。所以机器学习技术的普及化，是这一波人工智能革命的真正意义。说不定十年后，软件工程师懂机器学习技术，就跟懂关联式数据库一样稀松平常，只是基本技能的一种。

魔术不是真的魔术，只是变魔术的人让观众产生错觉，觉得他有魔法、不可思议的事情发生了；人工智能不是智慧，至少在现在这个阶段还是如此，只是开发人工智能的人让使用者产生错觉，觉得程序有智慧罢了。

但随着人工智能技术的普及，当我们对这些程序越来越熟悉，也许我们就不再觉得人工智能那么神奇，那么有智慧了，也就是人工智能真正改变这个世界的时候。

然而在当下的许多讨论中，我发现梦想与现实的鸿沟无比巨大——许多人认为大数据加上AI是万灵丹，但其实，要先经过以下层层思考，才知道它是不是真的能为你带来商业价值。

拿大数据这部分为例，首先，最重要的是，要问对问题。要先知道你想要达到什么目的，想要知道什么，才能够知道自己需要什么数据，进行什么样的分析。

接着要问：

· 你的数据怎么来？

· 你有现有可用的数据吗？

· 平常有收集数据的渠道和习惯吗？

· 不同部门之间的数据可以相容吗？

· 数据的可用性以及权限足够吗？（即使是同一公司，各部门的数据也常常未整合，要先经过非常多的沟通，才能得到所需的数据使用权限）

· 数据传得出来吗？（有些数据产生在客户的内网里，根本无法传出来）

· 没有既有数据的话，数据要从哪里来？从传感器？摄影机？人工登录？

· 这些数据的来源稳定且足够吗？会有法律的问题吗?

· 数据的获取会有误差吗？（例如摄影机的视频数据，随着安装位置的不同，准确度会有相当大的差别）

接着还得问：

· 公司的基础建设，足够支持这些数据的持续传输或是储存吗？

· 运算主机可以持续访问数据库的数据吗？

持续传输与储存的需求看似容易，但若是数据量较大，比如高分辨率视频数据，其实会是不容小觑的成本；若是无法稳定传输，则数据的误差则可能会加大。

终于确认可以得到数据，也有足够的传输频宽与储存了，接下来还需要清洗数据。

有时候，这些数据是很“脏”的，这是个两难。一开始采用大数据时的初衷，是要从尽量多的数据中找出有意义的价值，所以可能什么都先抓下来再说，但其中可能有误差或是不够精准的数据。若是数据有问题，就无法产生有价值的结论，又或是像之前几个被玩坏的聊天机器人。

另外一种“脏”是数据用语与格式的不统一，例如同样的一个“金额”的数据，可能在有些文件里叫做“金额”，有些叫做“价钱”，有些用“$”符号取代，全半角还不一样，同样的项目有不一样的称呼，都会造成分析的困难，需要进一步统一。

终于把数据收集好并洗干净了，此时才真正要开始分析数据了。此时才是讨论分析方法、算法、如何训练电脑学习、如何从这些数据中挖掘出一些模式或趋势的时候。

人工智能现代方法,人工智能技术能否学会

接着，当我们挖掘出这些趋势，它只是一个“现象”，这些现象要进一步解读，进而产生有商业价值的决策。此时，领域知识就相当重要。具有足够的领域知识，才能知道这些现象在这个行业中代表什么意义，也能判断什么样的结果是有价值的，什么样的结果是有误差的。例如我们可以利用摄影机数据，判断出商店的“热区图”——最多客人有兴趣，逗留最久的地方，结果老板一看就说，这里是休息区，这里是试鞋区，这里是结帐区，当然人待在这几个地方最久啊！一秒被打脸，这样的结果就是没有商业价值的。

若是有领域知识，非常简单的数据与趋势，就能产生非常有价值的结论了，例如非常简单的“人流计算”，计算有多少人流走进店里，有经验的客人就知道将人流计算跟结帐数据结合，转换为“提袋率”，或是将进店人流与进试衣间试穿的人流比较，推估出“试穿率”，再从结帐数据推估出“试穿后购买率”，这些简单的数据，都能产生出不简单的结论与实现方案。

人工智能现代方法,人工智能技术能否学会

当这些趋势真的有办法转换为有价值的商业策略，接下来还要能推动与执行才行。许多公司即使知道数据分析出这样的趋势，讨论出公司策略与走向的改变，但真正要推动变革，还是有困难的，更多的是反过来让数据分析的结果，为现有决策背书歌功颂德，“先射箭再画靶”，而非真正想追求改变与进步。

当你终于打通以上关卡，记得时时利用新得到的数据，检验这个改变的策略是否成功，并持续修正。反之，若是一上来就想要打大Boss，结果就是——你以为自己是亚马逊，其实是鲁宾逊，在数据之海漂流，最终被困在各种技术名词与算法的荒岛上而已。

—————————————————————————

关注公众号：“sunzhichaoshuo” 或 “孙志超说” 分享更多干货

若有问题，微信公众号点“有问就提”加入孙志超的知识星球，我会认真回答。