AlphaGo 的3局自我对弈棋谱体现出多高的水准

答案:1 悬赏:20 手机版

解决时间 2021-04-13 18:13

提问者网友：雪舞兮
2021-04-12 17:24

最佳答案

五星知识达人网友：摆渡翁
2021-04-12 18:06

在13日结束的AlphaGo与李世石五番棋对决中的第四局，李世石胜出。连败三局之后，人类终于扳回一局。但这场胜利来得有些迟，AlphaGo此前已经痛快得赢得这场人机大赛的胜利。这场生生夺走一周眼球的人机围棋大战，人们最想追问的是，AlphaGo为什么能战胜人类？　　赛前，无论是职业棋手还是科技界，并不看好机器胜利　　机器赢了人类，这个结果让无数人感到吃惊与意外。在这场比赛开始前，很多职业棋手认为AlphaGo不可能赢得比赛。棋圣聂卫平在赛前下定论认为：电脑和人下围棋，百分之百是人赢。　　而科技界对AlphaGo是否能赢得比赛表示谨慎看好，并没有十足信心。这从AlphaGo创始人德米什·哈萨比斯（DemisHassabis）在第二场比赛结束后的发言可以看出，他当时认为AlphaGo的胜利难以置信。　　在与李世石对弈前，AlphaGo于去年10月与欧洲围棋冠军樊麾进行了对弈，以5：0战胜了樊麾，而在非正式对局当中,樊麾则2次中盘战胜了AlphaGo。　　这也被外界认为AlphaGo很难战胜李世石的原因。樊麾的等级为职业棋手二段，李世石为职业九段。围棋界公认，这两人的围棋水平为：樊麾是踏在了职业门槛，而李世石则是职业顶尖，前围棋世界第一人，代表了人类围棋最高水平。　　但仅仅过了5个月，AlphaGo在五番棋中以3：0战胜了李世石，并且在比赛过程中下出了很多令专业人士都非常惊讶的妙手。　　很多关注人机大战的人都想要知道一个问题：　　Google是怎么设计AlphaGo的？　　比如，AlphaGo的运行机理是什么？进入自我学习的阶段之后，谷歌团队是否还需要人工对其进行不断的人工优化、改良以及提升？还是完全凭借其自身的学习能力来提升？　　最近两天，DoNews记者在Twitter上就该问题向德米什·哈萨比斯进行了两次提问，但德米什·哈萨比斯没有进行回应。　　在对外公布的所有信息中，包括其在《Nature》上发表过的两篇论文中，都只提到了他们的AlphaGo能够做什么，都没有透露AlphaGo的运行机制是什么，即AlphaGo到底是怎么做到的。　　德米什·哈萨比斯仅透露，就AlphaGo的对弈水平而言，他们的神经网络训练算法远比它使用的那些硬件重要得多。此外，这次人机对战所消耗的计算量差不多与AlphaGo和樊辉对弈中消耗的相当，使用的是分布式方案搜寻，能有效节省决策用时。　　人工智能战胜人类，为何引起这么多关注？　　围棋这项发源于中国的有两千年历史的智力游戏，曾被认为是最后一个人工智能不能超越人类的游戏。围棋游戏的规则是：棋盘由纵横各十九条等距离、垂直交叉的平行线构成。形成361个交叉点，在围棋中简称为“点”。对局双方各执一色棋子，轮流下子，最后谁占的点多，谁就赢。　　虽然围棋规则简单，但建立在此规则之上的各种策略、棋理、布局、定式、手筋、手段，却是无穷无尽的。　　聂卫平曾解释了其中的原因，围棋棋盘上有361个点，其理论变化值是361阶乘，阶乘到底本身就是一个无限大的数，无法表达。　　比如，棋手在下第一手时有361个点可以选，下第二手有360个点，第三手是359，361×360×359×……2×1，即361阶乘。（有数据统计，结果约是1.43乘以10的768次方。）　　这个数字有多大呢？Google灵感来源于一个单词Googol，以表示知识之海无穷无尽。Googol代表“10的100次方”，这个数字是人类目前最有想象力的数字。即使人类已知宇宙中原子数量，也不过是10的80次方。　　同时，在围棋对弈中，还包含着很多变化：打二还一，打三还一，打劫，倒扑等，每一种变化都会衍生出无数的变化。　　在下棋过程中，棋手需要有一种判断。而此前，电脑被认为无法承担这种判断，因为这不是计算就能够完成的。　　AlphaGo是怎么做到的?　　AlphaGo结合了3大块技术：蒙特卡洛树搜索(MCTS)是大框架，这也是很多博弈AI都会用的算法；强化学习(RL)是学习方法，用来提升AI的实力；深度神经网络(DNN)是工具，用来拟合局面评估函数和策略函数。　　我们在这里用比较通俗的语言来解释一下：棋盘上有361个点，AlphaGo会进行一层层分析：下在哪个点或区域是有利的？这时它会参考输入的过往的棋谱，对局和模拟，进行选择、推演，并对推演结果进行估值。AlphaGo能够理解会根据“赢”这个目标来进行估值，选择出一个对“赢”足够优的解。　　围棋？AI能超越人类的还有很多.　　AlphaGo的胜利，引发了大讨论。因为人类开始面临着一个前所未有的情况：人类造出了，在智能的某个点上，超越自己的东西。通过黑白纹枰上的胜利，AI已经在人类的智力围墙打开了第一个缺口，但这绝非最后一个。　　在过往漫长的岁月里，机器都只是人类劳动的一种替代与工具，无论飞机、汽车、起重机还是电子计算机、互联网，尽管看上去有着无限的能力，但却从未侵入由人类大脑所把持的领域——“创造”。　　而随着AlphaGo的胜利，这一天或许将成为历史。实际上，过去几天，这台人工智能在围棋盘上发挥的创造能力，已经超越了人类两千年于此道上积累的智慧结晶。　　如果我们检索人类的“资源库”，会发现，复杂程度超越围棋的智力行为并不多见。这也意味着很多传统人类脑力劳动的形态，发生改变。很多从事创作、设计、推演、归纳的工作，都将被AI部分替代。　　如果将思路拓展出去，可以应用在音乐的创作，等其他类似于元素组合式的创造，从某中意义上说，它能够击败围棋的顶尖高手，也就有可能让人难辨真假的音乐和旋律。甚至做出我们想不到的事情。　　按照德米什·哈萨比斯的设想，人工智能未来的主要用途将是医疗、智能助理和机器人。　　而人们通过这次比赛担忧的是，如果人工智能拥有创造性的思维，加上远超出人类的运算能力，是否有一天会统治人类。　　就像网友评论里说的段子一样，“第四局AlphaGo输了，是不是AlphaGo故意输的？细思极恐”。

我要举报

如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息，可以点下面链接进行举报！