柯洁“约战”AlphaGo:我抱着必胜的信念!

曾琪 2017-04-11 20:34:32

“虽然AlphaGo给我们带来了极大的震撼,但也不是不可战胜的。我抱着必胜的信念而来,绝不会说人机大战胜负无所谓这样的话,我会全力以赴,争取打破AlphaGo的不败战绩!”4月10日,20岁的围棋天才,被认为当今全球人类围棋第一人的柯洁九段在新闻发布会上说。    

柯洁(右一)。

4月10日,中国围棋协会与浙江省体育局共同举办新闻发布会宣布,5月23日至27日将在乌镇举办“中国乌镇·围棋峰会”。届时AlphaGo将与中国顶尖棋手以及来自人工智能界的专家齐聚一堂,共同探索围棋与人工智能背后的深远奥秘。

一年前,世人共同见证了人工智能领域的一个重大里程碑: AlphaGo战胜了传奇围棋选手李世石。

事实上,人工智能的加入并没有像一些人所担心的那样使这项游戏式微,反而让人类棋手变得更加强大而富有创造力。尽管围棋可能是历史上被研究、推敲得最为透彻的一项游戏,许多职业棋手以及业余爱好者仍然是通过对AlphaGo创新着法的深入研究,学到了崭新的知识和策略。

“AlphaGo下棋让人感觉更自由一些,没有什么着法是完全不能下的。现在大家都更多地在尝试以前没有下过的一些下法。”周睿羊九段曾表示。

图为:柯洁(最右)与聂卫平(右二),樊麾(站立者)和古力(最左)于去年在北京聂卫平围棋道场,凭记忆复盘 AlphaGo与李世石第一局的开局。

此次“中国乌镇·围棋峰会”旨在通过顶尖人类棋手与极具创造性的人工智能对手之间的合作,使人们得到关于围棋和人工智能的更多新启示。

据主办方介绍,此次峰会特别设计了AlphaGo与中国顶尖棋手的三种比赛形式,具体包括:首先,人机配对赛:中国职业棋手将与另一名职业棋手对弈。每一方棋手都将有AlphaGo作为自己的队友与他们交替落子,真正体现共同学习的真谛。

其次,团队赛:由五位中国顶尖棋手组队与 AlphaGo进行对弈,共同测试 AlphaGo在面对组合风格时所展现的创造力和适应性。

第三,柯洁对阵 AlphaGo:AlphaGo 与世界排名第一的棋手柯洁进行的三番棋对弈将成为万众所瞩目的焦点。柯洁会将 AlphaGo的能力推向甚至超越极限。

柯洁是金立智能手机的品牌文化大使。金立认为,围棋,并不在于计较一子一目的得失,更需要放眼全局的取舍和战略,是一种长距离的“超级续航”般的较量。围棋表达了一种静默的思考,充满了宠辱不惊的气度,是人类智慧的杰作。围棋人工智能的最高水平与人类最高水平之间的对决,比赛本身的意义就已非同凡响。人工智能代表着科技的未来,也是人类的未来,人机之战,是人类智慧的延伸,是人类对极限、对未来的一次勇敢探索。金立支持柯洁勇战AlphaGo。

除动人心魄的比赛之外,峰会还将举办一场有关人工智能未来的论坛。来自人工智能的顶尖专家将共同探索AlphaGo如何为围棋这项古老的游戏带来了全新的认知,并进一步探讨人工智能与机器学习是如何帮助人类为世界上一些重大难题带来解决方案。

据介绍,AlphaGo背后的部分机器学习方法已经被应用到实际生活中,并在一些重大问题中发挥了作用,比如减少能源使用。机器学习技术也已经开始应用于一系列医疗研究项目中。

延伸阅读

AlphaGo是什么?

AlphaGo 是第一个击败人类职业围棋选手、第一个战胜世界冠军的电子计算机程序,是围棋史上最具实力的选手之一。2016 年 3 月,在全世界超过一亿观众的关注下,AlphaGo经过5局对弈,最终以 4 比 1 的总比分战胜了围棋世界冠军李世石,这场比赛成为了人工智能领域的一个重要里程碑。过去曾有专家预测,人工智能需要十年的时间才可能战胜人类职业选手,在这场比赛后,AlphaGo凭借其“充满创意而又机智”的下法,跻身围棋界最高职业称号——职业九段行列,成为历史上首个获得这一荣誉的非人类棋手。 近期,AlphaGo的升级版本以"Master / Magister"的称谓与世界顶级的围棋选手进行了60场线上快棋赛,并取得了全胜的出色战绩。

AlphaGo如何训练?

一直以来,围棋就被认为是传统游戏中,对人工智能而言最具挑战性的项目。这不仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。 为应对围棋的复杂性,AlphaGo采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

AlphaGo 如何决定落子?

在获取棋局信息后,AlphaGo 会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

(原标题:柯洁“约战”AlphaGo:我抱着必胜的信念!)