围棋人机大战终章柯洁投子认输 AlphaGo从此退役

翻墙必看的中共禁闻,禁网新闻,大陆新闻中国新闻解读评论,禁闻点击排行榜

交流评论、关注点赞

围棋人机大战终章柯洁投子认输 AlphaGo从此退役

2017年05月27日 23:58 PDF版分享转发

在为期5天的“中国乌镇·围棋峰会”中，中国棋手世界排名第一的柯洁与AlphaGo 人工智能展开人机大战，三番棋首局较量在23日打响，第一局柯洁以四分之一子惜败AlphaGo，25日举行的第二局比赛则因柯洁盘中认输提前1个多小时结束，大比分2:0。在今日进行的最后一局中，柯洁盘中再度认输，终结了这场轰轰烈烈的人机大战。

在第三局中，AlphaGo执黑子，柯洁执白子。早早陷入困局的柯洁虽以放手一搏挽回些许，但仍不敌AlphaGo，最终柯洁选择投子认输。柯洁在赛后表示AlphaGo很完美：

“能参加这次比赛是我最大的荣幸。对我而言，这次比赛的意义超出人类之前所有比赛。今天的棋我以为能下的好一点，没想到在布局阶段就走岀了一步我自己都无法原谅的恶手，后面就一直很困难。连坚持下去都很难，因为它实在太完美了，没有任何缺陷，没有波动。我真的很责怪自己，没有下的更好一点。我希望自己能做得更好一点，我觉得自己没能做到，因此我不想说这是个双赢的局面，我真的很难过。可能和其他人的看法不同，我觉得真的很糟糕。”

常昊九段解说称，人类对相对容易量化的感觉好一点，但对中腹部难量化的感觉要差。去年与李世石对战的AlphaGo还有点人类的影子，现在的AlphaGo则完全走着自己的招法，人类很难预测。

Ad：美好不容错过，和家人朋友一起享受愉快时光，现在就订票

有趣的是，在最终较量中，AlphaGo走出一对的执子步意义不明的“怪招”，现场解说一度怀疑代其“扑克脸”黄世杰博士落错棋子。

第二局过后，柯洁称AlphaGo2.0接近上帝，自己中途以为很接近胜利，但因为太紧张“后面又下了一些不好的棋”。“棋圣”聂卫平则评价称，“柯洁想赢估计只能靠找到bug，或者我们派小鱼儿去拔个电源什么的。”

除了连续三局战胜柯洁，AlphaGo还在团队赛中虐了一把人类。在周五举行的团队赛中，由陈耀烨、时越、芈昱廷、唐韦星、周睿羊组成的队伍遭 AlphaGo“团灭”。人类在开局阶段落后太多，尽管在收官阶段频频放出好手，但因前期差距始终不能弥补，最终仍没能抵挡住 AlphaGo，国手团队254手投子认输。

不过，AlphaGo团队在第三局之后宣布AlphaGo退役，称本次中国乌镇围棋峰会为其参加的最后对弈比赛。

Alpha Go2.0的自我学习远强于初代的深度学习

全天候科技日前指出，AlphaGo初代使用的是深度学习，需用数据训练机器人。但AlphaGo2.0则可自我学习，能从自己跟自己的对弈中提升。二者的差别相当于顶级大师和职业玩家中层水平的差距，所以柯洁才说“第一场不是我输了1/4子，而是机器只想赢我1/4子。”

此次的柯洁对战AlphaGo和去年李世石对战的Alpha Go有什么区别呢？首先，与李世石对战的AlphaGo初代使用的是深度学习法，通过不断的图谱和各类棋局的陪练，使得AlphaGo不断的获得数据，具备对抗各类局势的能力。说白了，就是用数据来训练机器人，要知道AlphaGo训练时使用了超过16万个人类棋谱，在加上其建立在数据的基础上，又通过与自身的对战完成了3000万个棋谱的对决，最终得到了几万个模式用来对抗人类高手。

但是，AlphaGo2.0则可以完全摒弃人类的棋谱，通过设定规则后允许人工智能程序从0开始，不需要依托任何外来数据和各种人类棋谱，就是凭借自身内部的不断对弈，然后发掘各类棋路和变数，从在不断的攻守之间推导出各类对决的方案和方法。简单来说，就是不接受任何人类围棋经验，只需要知道规则，然后就自己跟自己对战，从对战的博弈不断学习和提升。

围棋AI：人工智能发展的缩影

广发证券分析师张超在报告中指出，围棋AI的迅速发展是近年人工智能突破性一个缩影。后者突飞猛进的原因主要有以下几点：算法的突破、数据的增长、硬件的发展和开源软件的流行。

广发张超进一步指出，深度增强学习是AlphaGo的核心技术：

围棋AI的决策是一个增强学习的过程。当前的棋局是状态，能否赢棋是奖赏，策略就是根据状态走子的决策方法。AlphaGo通过两个深层神经网络解决了价值函数的估计和策略的计算，就是策略网络和价值网络。通过价值网络与策略网络相结合的方式，AlphaGo摆脱了穷举法的庞大计算量；通过大量的训练，ALphaGo迅速成长，最终站到了围棋人工智能的最高点。

来源：华尔街见闻

喜欢、支持，请转发分享↓Follow Us 责任编辑：小婉

交流评论、关注点赞

围棋人机大战终章 柯洁投子认输 AlphaGo从此退役

热门禁书

围棋人机大战终章柯洁投子认输 AlphaGo从此退役