永发信息网

AlphaGo 的3局自我对弈棋谱体现出多高的水准

答案:1  悬赏:20  手机版
解决时间 2021-04-13 18:13
AlphaGo 的3局自我对弈棋谱体现出多高的水准
最佳答案
在13日结束的AlphaGo与李世石五番棋对决中的第四局,李世石胜出。连败三局之后,人类终于扳回一局。但这场胜利来得有些迟,AlphaGo此前已经痛快得赢得这场人机大赛的胜利。这场生生夺走一周眼球的人机围棋大战,人们最想追问的是,AlphaGo为什么能战胜人类?  赛前,无论是职业棋手还是科技界,并不看好机器胜利  机器赢了人类,这个结果让无数人感到吃惊与意外。在这场比赛开始前,很多职业棋手认为AlphaGo不可能赢得比赛。棋圣聂卫平在赛前下定论认为:电脑和人下围棋,百分之百是人赢。  而科技界对AlphaGo是否能赢得比赛表示谨慎看好,并没有十足信心。这从AlphaGo创始人德米什·哈萨比斯(DemisHassabis)在第二场比赛结束后的发言可以看出,他当时认为AlphaGo的胜利难以置信。  在与李世石对弈前,AlphaGo于去年10月与欧洲围棋冠军樊麾进行了对弈,以5:0战胜了樊麾,而在非正式对局当中,樊麾则2次中盘战胜了AlphaGo。  这也被外界认为AlphaGo很难战胜李世石的原因。樊麾的等级为职业棋手二段,李世石为职业九段。围棋界公认,这两人的围棋水平为:樊麾是踏在了职业门槛,而李世石则是职业顶尖,前围棋世界第一人,代表了人类围棋最高水平。  但仅仅过了5个月,AlphaGo在五番棋中以3:0战胜了李世石,并且在比赛过程中下出了很多令专业人士都非常惊讶的妙手。  很多关注人机大战的人都想要知道一个问题:  Google是怎么设计AlphaGo的?  比如,AlphaGo的运行机理是什么?进入自我学习的阶段之后,谷歌团队是否还需要人工对其进行不断的人工优化、改良以及提升?还是完全凭借其自身的学习能力来提升?  最近两天,DoNews记者在Twitter上就该问题向德米什·哈萨比斯进行了两次提问,但德米什·哈萨比斯没有进行回应。  在对外公布的所有信息中,包括其在《Nature》上发表过的两篇论文中,都只提到了他们的AlphaGo能够做什么,都没有透露AlphaGo的运行机制是什么,即AlphaGo到底是怎么做到的。  德米什·哈萨比斯仅透露,就AlphaGo的对弈水平而言,他们的神经网络训练算法远比它使用的那些硬件重要得多。此外,这次人机对战所消耗的计算量差不多与AlphaGo和樊辉对弈中消耗的相当,使用的是分布式方案搜寻,能有效节省决策用时。  人工智能战胜人类,为何引起这么多关注?  围棋这项发源于中国的有两千年历史的智力游戏,曾被认为是最后一个人工智能不能超越人类的游戏。围棋游戏的规则是:棋盘由纵横各十九条等距离、垂直交叉的平行线构成。形成361个交叉点,在围棋中简称为“点”。对局双方各执一色棋子,轮流下子,最后谁占的点多,谁就赢。  虽然围棋规则简单,但建立在此规则之上的各种策略、棋理、布局、定式、手筋、手段,却是无穷无尽的。  聂卫平曾解释了其中的原因,围棋棋盘上有361个点,其理论变化值是361阶乘,阶乘到底本身就是一个无限大的数,无法表达。  比如,棋手在下第一手时有361个点可以选,下第二手有360个点,第三手是359,361×360×359×……2×1,即361阶乘。(有数据统计,结果约是1.43乘以10的768次方。)  这个数字有多大呢?Google灵感来源于一个单词Googol,以表示知识之海无穷无尽。Googol代表“10的100次方”,这个数字是人类目前最有想象力的数字。即使人类已知宇宙中原子数量,也不过是10的80次方。  同时,在围棋对弈中,还包含着很多变化:打二还一,打三还一,打劫,倒扑等,每一种变化都会衍生出无数的变化。  在下棋过程中,棋手需要有一种判断。而此前,电脑被认为无法承担这种判断,因为这不是计算就能够完成的。  AlphaGo是怎么做到的?  AlphaGo结合了3大块技术:蒙特卡洛树搜索(MCTS)是大框架,这也是很多博弈AI都会用的算法;强化学习(RL)是学习方法,用来提升AI的实力;深度神经网络(DNN)是工具,用来拟合局面评估函数和策略函数。  我们在这里用比较通俗的语言来解释一下:棋盘上有361个点,AlphaGo会进行一层层分析:下在哪个点或区域是有利的?这时它会参考输入的过往的棋谱,对局和模拟,进行选择、推演,并对推演结果进行估值。AlphaGo能够理解会根据“赢”这个目标来进行估值,选择出一个对“赢”足够优的解。  围棋?AI能超越人类的还有很多.  AlphaGo的胜利,引发了大讨论。因为人类开始面临着一个前所未有的情况:人类造出了,在智能的某个点上,超越自己的东西。通过黑白纹枰上的胜利,AI已经在人类的智力围墙打开了第一个缺口,但这绝非最后一个。  在过往漫长的岁月里,机器都只是人类劳动的一种替代与工具,无论飞机、汽车、起重机还是电子计算机、互联网,尽管看上去有着无限的能力,但却从未侵入由人类大脑所把持的领域——“创造”。  而随着AlphaGo的胜利,这一天或许将成为历史。实际上,过去几天,这台人工智能在围棋盘上发挥的创造能力,已经超越了人类两千年于此道上积累的智慧结晶。  如果我们检索人类的“资源库”,会发现,复杂程度超越围棋的智力行为并不多见。这也意味着很多传统人类脑力劳动的形态,发生改变。很多从事创作、设计、推演、归纳的工作,都将被AI部分替代。  如果将思路拓展出去,可以应用在音乐的创作,等其他类似于元素组合式的创造,从某中意义上说,它能够击败围棋的顶尖高手,也就有可能让人难辨真假的音乐和旋律。甚至做出我们想不到的事情。  按照德米什·哈萨比斯的设想,人工智能未来的主要用途将是医疗、智能助理和机器人。  而人们通过这次比赛担忧的是,如果人工智能拥有创造性的思维,加上远超出人类的运算能力,是否有一天会统治人类。  就像网友评论里说的段子一样,“第四局AlphaGo输了,是不是AlphaGo故意输的?细思极恐”。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
电信主副卡全国都可以用么?
我是超级QQ为什么不能进QQ农场?
净身房是什么意思
中国的哪个省的东西最不便宜?
正在派件要等多久,申通正在派件的快递多久到
百老汇裤行二部地址在什么地方,想过去办事
世界大陆上最大的断裂带?
摔破头 风水上怎么解释
诛仙3炼制破军武器的炼妖藤在哪里得
为什么都说双鱼座的人渣渣
一桶油重15千克,倒出它的5分之4,正好可以装
无锡银乐迪和钱贵的收费方式,6个人要用多少
现在DNF还可以领QQ会员红色风暴么
白鹿原描述景色的句子,描述风景与人生的诗句
苹果手机刷完机短信全没了,怎么找到
推荐资讯
已是正处级干部调任公务员副处岗位能保留正处
生活处处有物理,留心观察皆学问.你知道吗?
诛仙2投资100左右能玩成什么样子的?
为什么晚上睡觉半夜醒来时满身大汗?
下列划线字注音正确的一组是A;(2分)A. 蹒跚
微博都有那几家?
马坑我想知道这个在什么地方
无尽空间2主角光环mod怎么用
咋样才知道手机是不是行货?教教我好吗?我怕
127期**开什么
已知一次函数y=(6+3m)x+(n-4),当m______
卫衣的布料用英语怎么说
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?