新闻中心

天津大学OPTICA&SPIE学生分会
电话： 022-27400892
地址： 天津市南开区卫津路92号天津大学
联系人： 胡小龙教授
网站： www.tjuosa-spie.com
电子邮件： tju_osa@163.com

您的位置：首页 > 新闻中心 > 活动通知 > AlphaGo Zero横空出世

AlphaGo Zero横空出世

今天我们要讲的是一对兄弟之间博弈，竞争的故事。这对兄弟是谁呢？

还记得去年击败围棋九段李世石的人工智能AlphaGo吗，AlphaGo代表人工智能在围棋领域首次战胜了人类的世界冠军。AlphaGo的获胜让全世界范围内都惊叹于人工智能的惊艳表现，以及对人工智能领域的无限看好。AlphaGo对围棋的理解是建立于在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上，进而自我训练，实现超越。也就是说，它依靠的是自己强大的计算学习能力，学习的是人类已有的知识。因此如果要究其根源，作为兄长的AlphaGo并不算是彻彻底底的依靠自我能力成长的人工智能。

今天的主角是身为弟弟的AlphaGo Zero，虽说骨肉相连，形貌神似，但却不是师出同门。AlphaGo Zero完全

从零开始，没有任何历史棋谱的指引，没有人类的现场指导，更没有参考人类任何的先验知识，完全靠自己一

个人强化学习和参悟，棋艺增长远超AlphaGo，并以大比分100：0的成绩完胜AlphaGo。

看到这里我们当然会想，AlphaGo Zero是依靠什么能力来击败的AlphaGo呢？

我们先来看看AlphaGo Zero的棋局

对于不懂围棋的小伙伴来说看棋局如同天书一般，所以我们听听专业棋手的解释：“它的开局与收官和专业棋手的下法并无区别，人类几千年的智慧结晶，看起来并非全错。但是中盘看起来则非常诡异。”这个诡异之处可以理解为人类经验由于样本空间大小的限制，往往都收敛于局部最优而人工智能则能突破这个局部最优，从全局考虑并且一直向收敛的方向前进。

我们再来看AlphaGo Zero的学习过程