交流评论、关注点赞

  • Facebook Icon脸书专页
  • telegram Icon翻墙交流电报群
  • telegram Icon电报频道
  • RSS订阅禁闻RSS/FEED订阅

围棋人机大战终章 柯洁投子认输 AlphaGo从此退役

2017年05月27日 23:58 PDF版 分享转发

在为期5天的“中国乌镇·峰会”中,棋手世界排名第一的展开,三番棋首局较量在23日打响,第一局柯洁以四分之一子惜败AlphaGo,25日举行的第二局比赛则因柯洁盘中认输提前1个多小时结束,大比分2:0。在今日进行的最后一局中,柯洁盘中再度认输,终结了这场轰轰烈烈的人机大战。

在第三局中,AlphaGo执黑子,柯洁执白子。早早陷入困局的柯洁虽以放手一搏挽回些许,但仍不敌AlphaGo,最终柯洁选择投子认输。柯洁在赛后表示AlphaGo很完美:

“能参加这次比赛是我最大的荣幸。对我而言,这次比赛的意义超出人类之前所有比赛。今天的棋我以为能下的好一点,没想到在布局阶段就走岀了一步我自己都无法原谅的恶手,后面就一直很困难。连坚持下去都很难,因为它实在太完美了,没有任何缺陷,没有波动。我真的很责怪自己,没有下的更好一点。我希望自己能做得更好一点,我觉得自己没能做到,因此我不想说这是个双赢的局面,我真的很难过。可能和其他人的看法不同,我觉得真的很糟糕。”

常昊九段解说称,人类对相对容易量化的感觉好一点,但对中腹部难量化的感觉要差。去年与对战的AlphaGo还有点人类的影子,现在的AlphaGo则完全走着自己的招法,人类很难预测。

Ad:美好不容错过,和家人朋友一起享受愉快时光,现在就订票

有趣的是,在最终较量中,AlphaGo走出一对的执子步意义不明的“怪招”,现场解说一度怀疑代其“扑克脸”黄世杰博士落错棋子。

第二局过后,柯洁称AlphaGo2.0接近上帝,自己中途以为很接近胜利,但因为太紧张“后面又下了一些不好的棋”。“棋圣”聂卫平则评价称,“柯洁想赢估计只能靠找到bug,或者我们派小鱼儿去拔个电源什么的。”

除了连续三局战胜柯洁,AlphaGo还在团队赛中虐了一把人类。在周五举行的团队赛中,由陈耀烨、时越、芈昱廷、唐韦星、周睿羊组成的队伍遭 AlphaGo“团灭”。人类在开局阶段落后太多,尽管在收官阶段频频放出好手,但因前期差距始终不能弥补,最终仍没能抵挡住 AlphaGo,国手团队254手投子认输。

不过,AlphaGo团队在第三局之后宣布AlphaGo退役,称本次中国乌镇围棋峰会为其参加的最后对弈比赛。

Alpha Go2.0的自我学习远强于初代的深度学习

全天候科技日前指出,AlphaGo初代使用的是深度学习,需用数据训练机器人。但AlphaGo2.0则可自我学习,能从自己跟自己的对弈中提升。二者的差别相当于顶级大师和职业玩家中层水平的差距,所以柯洁才说“第一场不是我输了1/4子,而是机器只想赢我1/4子。”

此次的柯洁对战AlphaGo和去年李世石对战的Alpha Go有什么区别呢?首先,与李世石对战的AlphaGo初代使用的是深度学习法,通过不断的图谱和各类棋局的陪练,使得AlphaGo不断的获得数据,具备对抗各类局势的能力。说白了,就是用数据来训练机器人,要知道AlphaGo训练时使用了超过16万个人类棋谱,在加上其建立在数据的基础上,又通过与自身的对战完成了3000万个棋谱的对决,最终得到了几万个模式用来对抗人类高手。

但是,AlphaGo2.0则可以完全摒弃人类的棋谱,通过设定规则后允许人工智能程序从0开始,不需要依托任何外来数据和各种人类棋谱,就是凭借自身内部的不断对弈,然后发掘各类棋路和变数,从在不断的攻守之间推导出各类对决的方案和方法。简单来说,就是不接受任何人类围棋经验,只需要知道规则,然后就自己跟自己对战,从对战的博弈不断学习和提升。

围棋AI:人工智能发展的缩影

广发证券分析师张超在报告中指出,围棋AI的迅速发展是近年人工智能突破性一个缩影。后者突飞猛进的原因主要有以下几点:算法的突破、数据的增长、硬件的发展和开源软件的流行。

广发张超进一步指出,深度增强学习是AlphaGo的核心技术:

围棋AI的决策是一个增强学习的过程。当前的棋局是状态,能否赢棋是奖赏,策略就是根据状态走子的决策方法。AlphaGo通过两个深层神经网络解决了价值函数的估计和策略的计算,就是策略网络和价值网络。通过价值网络与策略网络相结合的方式,AlphaGo摆脱了穷举法的庞大计算量;通过大量的训练,ALphaGo迅速成长,最终站到了围棋人工智能的最高点。

来源:华尔街见闻

喜欢、支持,请转发分享↓Follow Us 责任编辑:小婉