阿尔法狗是怎么创造出来的 (阿法狗厉害在哪)

暴风体育讯(陶冶 浙江乌镇报道)5月23日,“中国乌镇围棋峰会”在浙江乌镇景区开启,中国棋手世界排名第一的柯洁与AlphaGo人工智能展开围棋人机大战。比赛从上午10:30正式开始,柯洁执黑先行,经过289手激斗,近四个多小时连续酣战,柯洁最终以四分之一子的微弱劣势不敌AlphaGo。

柯洁的失利多少在业内人士意料之中,比赛中阿法狗滴水不漏,没有给柯洁任何可乘之机,如果说去年和李世石对战的那个版本的阿法狗还有弱点的话,那么今天与柯洁对弈的升级2.0版本,似乎完全找不到弱点了,赛后柯洁甚至有些苦涩得开玩笑自嘲,“要赢它很难,只能找些BUG。”

但阿法狗的创造者、DeepMind创始人戴密斯-哈萨比斯却说,AlphaGo自己也不知道自己有哪些bug。他说,来到乌镇举办这样的围棋峰会,就是希望柯洁这样伟大的棋手能够找到阿法狗的弱点,其实阿法狗并不清楚自己的弱点所在,在它自己更自己对弈的时候,也不知道有哪些缺陷。

实际上,此前Google已经透露,这次新版本的AlphaGo早已告别了“仅靠输入数据来进行计算的套路”,在高于原版10倍计算能力的基础上,它一直都在靠完全的自我学习和自我对弈来“积累经验”。换句话说,就是“AlphaGo已经是自己的导师”,甚至于它已经不满足于只是单纯取得胜利,而是控制胜利的概率以及输赢的差距。

这一点得到了DeepMind工程师的验证和确认,阿法狗总是要将它的获胜的概率最大化,而不是想要去赢得胜利,所以DeepMind要做一些决策,寻找确定的路线来实现扩大胜率,并且更少风险的获胜机会。当然对阿法狗来说这是一个取舍问题,甚至于控制胜率,这是DeepMind的一个探索方向。

阿法狗在围棋领域的对弈结果证明,它几乎已经是不可战胜的了,那么接下来的一个问题是,它是否能够帮助探索人类的极限。哈萨比斯坚持把阿法狗视为一个“工具”,一个可以更好为人类来服务的工具,来找到更多在其他领域可能性的工具。

DeepMind也承认,公司已经不满足于只由自己来打造AlphaGo,而是向开发者开放一些新的技术平台与工具,让开发者自己来做AlphaGo,为他们所用。现在已经有日本的开发者正在使用Google的一些技术制造“九段机器人”,也就是“高仿版AlphaGo”。

“我们有架构知识分享,让大家知道阿法狗自己如何工作,这就是我们为什么打造这项技术的初衷,我们希望它能够走进寻常百姓家,去发光发热,让人类克服他们的错误。”哈萨比斯说。