鏄熼檯浜夐湼2 2v2鍗佸ぇ宸呭嘲瀵瑰喅 (鏄熼檯浜夐湼2宸呭嘲鍗佸ぇ绮惧僵瀵瑰喅)

本周五,北京时间凌晨2点Deepmind将举行特殊直播活动,这也是在嘉年华公布消息之后很长时间内他们首次公开发布声明,但实际上,我们可以从此前的论文、访谈等大致了解它的这么长时间以来的进步和背后科学家的努力,以及对目前的实力到底如何做出大致分析。

鏄熼檯浜夐湼2鍗佸ぇ宸呭嘲鏃跺埢,鏄熼檯浜夐湼2v2鍗佸ぇ鎯ㄧ儓瀵瑰喅

首先,与和多人设想中的AI可以直接获取到游戏内的各种数据不同,Deepmind选择的是与暴雪合作开放API,并让AI通过类似人类视觉的方式获取各类信息,下图中左侧部分就是AI将游戏画面转换为了简化的低分辨率RGB图像数据。

鏄熼檯浜夐湼2鍗佸ぇ宸呭嘲鏃跺埢,鏄熼檯浜夐湼2v2鍗佸ぇ鎯ㄧ儓瀵瑰喅

而且,Deepmind表示为了不让AI以远超人类的操作速度来轻易打败人类(在《星际争霸》中,每分钟有效操作次数越高越好),为了使AI的操作与人相当,他们限制了AI的每分钟有效操作次数为180,这实际上来说是相对较低的,因此实际上AI与人类的操作相同——读取图像,并给键盘和鼠标发送指令,所以大家也不用担心AI“作弊”了。

Deepmind还表示,《星际争霸2》实际上对于他们来说是一个十分有趣的全新挑战“每场比赛都有不同的单位能力和游戏方式。玩家的行为受游戏内经济的支配; 必须收集矿物和天然气,以生产新的建筑物和单元。对方玩家同时建立他们的基地,但每个玩家只能在他们自己的单位范围内看到地图的一部分。因此,玩家必须派出单位侦察看不见的区域以获取有关其对手的信息,然后记住该信息很长一段时间。随着环境变得部分可观察,这将带来更复杂的挑战 - 与诸如国际象棋或围棋等完美信息游戏形成鲜明对比。”

鏄熼檯浜夐湼2鍗佸ぇ宸呭嘲鏃跺埢,鏄熼檯浜夐湼2v2鍗佸ぇ鎯ㄧ儓瀵瑰喅

正如他所说的,实际上《星际争霸2》对AI来说是一个非常相当的挑战,战争迷雾(信息差)的设定导致了更为挑战性的环境,而这也正是为何诸多厂商都在挑战《星际争霸》的原因。

正如Deepmind所说“《星际争霸》是当前AI研究的一个有趣的测试环境,因为它为AI学习现实世界的信息差提供了一个有用的桥梁。AI在游戏环境中进步并玩好星际争霸所需的技能最终可以转移到现实世界的任务中。”如果一个AI能在《星际争霸》上超越人类,那么在现实中的各种应用中就更近了一大步,我们也离未来更近了一步。

需要再次强调的是,Deepmind的AI并不是脚本BOT那类传统的“对抗电脑”中的电脑,而是一步步自我学习和强化,最终进步和成长的AI。

鏄熼檯浜夐湼2鍗佸ぇ宸呭嘲鏃跺埢,鏄熼檯浜夐湼2v2鍗佸ぇ鎯ㄧ儓瀵瑰喅

至于Deepmind的实力?在近期的暴雪嘉年华中团队吐露到,他们已经可以用农民击败作弊难度的电脑了,而目前已经过去了三个月,三个月对AI来说可能是指数级的变化,本次直播活动中他们还邀请了《星际争霸》的著名解说Artosis和Rotterdam,这次我们有可能看到AI与一个相对来说职业但是不是顶尖的选手交战,但我们应该不会看到AI直接击败最顶尖的职业交战。

话虽如此,正如在围棋时表现一样,很有可能我们会对AI的进步速度错判——即使前几天AI还不会修地堡,不代表几天后它不能吊打职业选手,不论如何,Deepmind一定会给大家展示一些我们可能会感到惊讶的东西,如果这次打败了职业选手,那下次可能就要挑战最顶尖的那位了。

也许Deepmind打败《星际争霸2》顶级选手的消息比我们想的还要近,也许AI在某方面遇到了问题短时间都无法和普通人一战,不论如何,时间会告诉我们一切,笔者也会第一时间报道最新消息的。