计算机博弈算法大赛中的计算机系统和4399小游戏里的电脑AI有啥区别?

对不起,您要访问的页面暂时没有找到,您可以:聂卫平是代表大部分以围棋为生的人说话的,本身也符合他的身份和地位。&br&&br&李世石输给了阿尔法狗对围棋界来说是一个巨大的灾难,而并非像很多人认为的双赢。当然短期来说围棋多了很多关注度,但是这种关注很多不过是路人读个新闻而已,热度过了就没了,对于围棋本身发展没有任何用处。&br&&br&围棋的作为一项寄生性很强的运动,投资它99%要亏。那为什么围棋会一路发展到现在呢?首要的因素是围棋有逼格。围棋自古以来作为文人四艺之一,其文化艺术附加值是很高的。现在很多亏本搞围棋的人的思路都是我搞下围棋提升下我企业的逼格;我搞下围棋提升下我这个活动的逼格。现在倒好,程序击败了人类最好的棋手之一。这意味着在围棋这个项目上,机器做得比人好。我们也知道,机器比人做得好的项目都不是艺术,而是技术。这瞬间就把围棋最重要的一层包装剥得干干净净,逼格瞬间跌穿地平线。&br&&br&这还不算完。围棋另外还承载的一层含义就是民族性,当年中国掀起全国性围棋热的重要因素是聂卫平在中日围棋擂台赛上极具戏剧化的胜利,中国人又一次自豪地站起来了,吸引了很多人投身于投资于围棋。然后就是苦大仇深的十年抗韩,这背后都有民族对抗的意味,这也吸引了大量持续的关注和投入,为围棋的繁荣提供了不可或缺的支持。现在从人人对抗民族对抗到人机对抗,这个也太虚无缥缈,叫人怎么投入感情。对于一个亏本生意来说,没有感情投入自然没有利益投入。而且人机大战的热度是以损害人人大战的热度为前提的,你连程序都下不赢,那下赢一个外国人又有什么好开心的。也就是说人机大战多举办一次,人们对围棋的持续性热度就会下降一点。&br&&br&更关键的是,人人对抗是一场集体对抗,利益均沾。擂台赛每方都能出一堆棋手,杯赛更是海选,很多人能分一杯羹。而人机大战,得利的只有围棋界最顶尖最有名的那一两个棋手。其他棋手和以围棋为生的人只能眼睁睁地看着人类棋手的失败和围棋光环一层层剥落。好处分不到,坏处要平摊,当然 有想法。&br&&br&有人觉得反正颓势不可逆还不如轰轰烈烈来一发再死,有人觉得留下精彩的对局最重要, 那有点站着说话不腰疼。像我们这种无关人士就算明天围棋 消亡了一样吃喝玩乐工作赚钱,自然容易豪情万丈。但对于吃围棋这碗饭的人,围棋的兴衰意味着他们能不能养家糊口,情操什么的都是奢侈品。能多保留一份围棋的神秘性就多保留一份,能减缓围棋的颓势就减缓一分。&br&&br&比如李世石惨败后知道自己恐怕是要砸很多人饭碗了,还是补救了一下,不惜自污说换个高手说不定能赢,给大家留下一个不确定因素,也给围棋界留了个希望。事实上现在还是有不少人认为换柯洁上说不定能赢。所以作为实力最强,信心最足的柯洁也一败涂地的话,那最后这么一点点不确定因素也没有了,围棋的光环恐怕最后是一点都留不下。没光环的围棋也就跟中国象棋差不多的平民运动,围棋棋手和象棋棋手的收入可是差了好多倍。&br&&br&当然柯洁本身没有问题,为了自己的利益去挑战阿尔法狗是天经地义。 但是作为中国围棋的领袖人物,聂卫平当然有责任为其他棋手和工作者说出他们的心里话,尽可能避免人机大战再次出现,这也是天经地义。大家都为自己的利益奔走呐喊而已。
聂卫平是代表大部分以围棋为生的人说话的,本身也符合他的身份和地位。 李世石输给了阿尔法狗对围棋界来说是一个巨大的灾难,而并非像很多人认为的双赢。当然短期来说围棋多了很多关注度,但是这种关注很多不过是路人读个新闻而已,热度过了就没了,对于围…
&figure&&img src=&/5c3a8795c52dbaf1dc9c8cb56b120e84_b.jpg& data-rawwidth=&1080& data-rawheight=&1070& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/5c3a8795c52dbaf1dc9c8cb56b120e84_r.jpg&&&/figure&可能有些地方没被墙,但是起码对于以上网站,我用的这个被墙检测网站的服务器所在地是被墙了的。&br&&br&讲真,先抛开人工智能究竟会不会背叛人类。&br&现在中华民族真的很危险啊,Google,Facebook,微软,DeepMind 等几个欧美公司以及一些日本的企业已经在人工智能上耕耘很久,并且已经有了不少的成果了。&br&而国内呢?不仅屏蔽了 Google ,Facebook 让国内毫无竞争,企业在人工智能上不甚认真, 国内除了声音挺大但可应用成果寥寥的百度以外还有啥?自由竞争才是刺激创新的最好方法。&br&&br&工业革命起源于能源的解放,发明开始层出不穷才让西方彻底抛开中国吊打中国一百年。&br&而我们即将面临的智能革命将带给人类远远超出工业革命的成果。而且基于强人工智能可以指数级(&img src=&///equation?tex=e%5E%7Bx%7D& alt=&e^{x}& eeimg=&1&&)自我迭代升级的特性,只有第一个研发出来强人工智能的组织可以完胜(因为指数级升级的关系,差的几年可能就是差成千上万倍,即使再增加机器数量,后来者差的那几年就永远没办法弥补了)。&br&&br&如果说工业革命让以英国为首的西方自此大幅领先世界是几千年未有的大变局,这次智能革命就将是十万年未有的大变局——自有人类这种智慧生物以来,第一次有其他智慧可以达到、赶超甚至远远抛下人类的智能水平。&br&&br&其他方面我再考虑一下。
可能有些地方没被墙,但是起码对于以上网站,我用的这个被墙检测网站的服务器所在地是被墙了的。 讲真,先抛开人工智能究竟会不会背叛人类。 现在中华民族真的很危险啊,Google,Facebook,微软,DeepMind 等几个欧美公司以及一些日本的企业已经在人工智能…
&p&谢谢邀请。&/p&&p&粗粗看了下棋谱,感觉非常震撼。个人感觉,有 3 个点特别值得注意:&/p&&br&&h2&&b&【1】阿老师的 “思维” 是没有连贯性的&/b&&/h2&&p&在阿老师自战谱中,脱先非常频繁,甚至到了匪夷所思的地步。究其原因,我猜是这样的:&/p&&p&在阿老师的算法中,它并不关注你上一手下在哪里(除非上一手是提劫这种受到围棋规则干扰的选点),&b&只关注当前的局面的最优解&/b&——听起来有点不可思议,但从围棋规则上来说,这种思路其实是完全正确的。&/p&&p&而人类无法摆脱连续思维的影响,一方面可能是受到了 “&b&沉没成本&/b&” 的影响,从情感上不愿意在已经投入大量思考的局部中解脱出来。另一方面,人类的思维能力、体力、时间有限,也无法真正地做到在每一时刻都能重新审视局面。&/p&&br&&h2&【2】阿老师是不讲“棋理”的&/h2&&p&阿老师的有些棋,在大部分学棋者看来是匪夷所思的,比如第一局中,在面对黑棋的迷你中国流时,白棋的连续 “碰” 定型让人瞠目结舌:&/p&&br&&figure&&img src=&/v2-6d6b71f5ef6c8a309335ecee6ea81254_b.png& data-rawwidth=&696& data-rawheight=&566& class=&origin_image zh-lightbox-thumb& width=&696& data-original=&/v2-6d6b71f5ef6c8a309335ecee6ea81254_r.png&&&/figure&&br&&figure&&img src=&/v2-de5_b.png& data-rawwidth=&696& data-rawheight=&561& class=&origin_image zh-lightbox-thumb& width=&696& data-original=&/v2-de5_r.png&&&/figure&&br&&p&棋理告诉我们,在棋局初期,不要主动在对方的势力范围内贴身肉搏。因此这种“碰”的着法容易被围棋老师认为是初学者非常容易犯的错误。但令人讽刺的是,这种如此“业余”的棋竟然是“让天下一先”的阿老师下出来的。&/p&&p&如此看来,我们过去总结出的一些“棋理”,很多也许是错的。&/p&&p&这不仅让我联想到 &b&传统医学&/b&。&/p&&p&传统医学给人的感觉,就是听起来挺像回事的,但其原理并不能被完全用逻辑搞清楚。当现代医学发展起来后,有些传统医学学说被一套更为科学的理论所替代,另有一些则被证明是错误的。&/p&&p&一个或许不算太恰当的比喻是:&b&阿老师的棋之于传统棋理,就如同现代医学之于传统医学&/b&。&/p&&br&&h2&【3】在阿老师的字典里,没有“冒险”这个词,与之相比,人类才是更喜欢“剪枝”的那个&/h2&&p&人类下棋的一个弱点,就是经常会拘泥于局部最优解,有时候局部最优解看不清楚,那就会选择简明的解。&/p&&p&举个例子。&/p&&p&如果有 2 种下法:第一种局部可以便宜1目棋,但整条大龙有死亡的危险;第二种局部亏1目棋,但整条大龙是净活,那么人类几乎一定会选择第二种下法,因为我们看不清楚大龙的危险程度,因此从数学期望上来说,第二种下法是更有利益可图的。&/p&&p&但阿老师则不一样。它或许会完全算清楚第一种情况下大龙是否会死,如果不会死,就会非常果断地选择第一种情况。&/p&&p&比如第 9 局:&/p&&br&&figure&&img src=&/v2-7f8b543b1d61e40d2f0ad3_b.png& data-rawwidth=&690& data-rawheight=&557& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&/v2-7f8b543b1d61e40d2f0ad3_r.png&&&/figure&&p&从局部来看,白 152 应该下在一路扳,这样白棋是净活,而现在白棋却选择了粘,局部黑棋可以杀死白棋。&/p&&p&粘相比于扳来说,可能会在官子上便宜一点点,但是却冒着整条大龙死亡的危险,作为人类绝对不会这么下。&/p&&p&但阿老师却这么下了。&/p&&p&我相信,这绝对不是因为阿老师没有算清楚局部变化(因为这个局部变化很简单),而是它算清楚了后续更多的变化,然后确信白棋粘并不会让大龙死亡,所以就是要争这一目棋。&/p&&p&这么看来,阿老师的算路,可真是深不可测啊。&/p&&br&&p&&b&# 向阿老师学习 #&/b&&/p&
谢谢邀请。粗粗看了下棋谱,感觉非常震撼。个人感觉,有 3 个点特别值得注意: 【1】阿老师的 “思维” 是没有连贯性的在阿老师自战谱中,脱先非常频繁,甚至到了匪夷所思的地步。究其原因,我猜是这样的:在阿老师的算法中,它并不关注你上一手下在哪里(…
&p&我的观点是:一是AI前进的速度比想象中更快,即便是行业内的人士都被AlphaGo Zero跌破眼镜;二是要正视中国在人工智能学术方面和英美的差距。&/p&&p&一方面,AlphaGo Zero的自主学习带来的技术革新并非适用于所有人工智能领域。围棋是一种对弈游戏,是信息透明,有明确结构,而且可用规则穷举的。对弈之外,AlphaGo Zero的技术可能在其他领域应用,比如新材料开发,新药的化学结构探索等,但这也需要时间验证。而且语音识别、图像识别、自然语音理解、无人驾驶等领域,数据是无法穷举,也很难完全无中生有。AlphaGo Zero的技术可以降低数据需求(比如说WayMo的数据模拟),但是依然需要大量的数据。&/p&&p&另一方面,AlphaGo Zero里面并没有新的巨大的理论突破。它使用的Tabula Rosa learning(白板学习,不用人类知识),是以前的围棋系统Crazy Stone最先使用的。AlphaGo Zero里面最核心使用的技术ResNet,是微软亚洲研究院的孙剑发明的。孙剑现任旷视科技Face++首席科学家。&/p&&p&虽然如此,这篇论文的影响力也是巨大的。AlphaGo Zero 能够完美集成这些技术,本身就具有里程碑意义。DeepMind的这一成果具有指向标意义,证明这个方向的可行性。&/p&&p&在科研工程领域,探索前所未知的方向是困难重重的,一旦有了可行性证明,跟随者的风险就会巨幅下降。我相信从昨天开始,所有做围棋对弈的研究人员都在开始学习或复制AlphaGo Zero。材料、医疗领域的很多研究员也开始探索。&/p&&p&AlphaGo Zero的工程和算法确实非常厉害。但千万不要对此产生误解,认为人工智能是万能的,所有人工智能都可以无需人类经验从零学习,得出人工智能威胁论。AlphaGo Zero证明了AI 在快速发展,也验证了英美的科研能力,让我们看到在有些领域可以不用人类知识、人类数据、人类引导就做出顶级的突破。&/p&&p&但是,AlphaGo Zero只能在单一简单领域应用,更不具有自主思考、设定目标、创意、自我意识。即便聪明如AlphaGo Zero,也是在人类给下目标,做好数字优化而已。&/p&
我的观点是:一是AI前进的速度比想象中更快,即便是行业内的人士都被AlphaGo Zero跌破眼镜;二是要正视中国在人工智能学术方面和英美的差距。一方面,AlphaGo Zero的自主学习带来的技术革新并非适用于所有人工智能领域。围棋是一种对弈游戏,是信息透明,有…
&p&-&/p&&p&三盘最高水平和规格的正式测试棋结束了,虽然第三局的水准仍然很高,柯洁明显也很尽力,但很遗憾的是,看上去柯洁并没有能在第三盘中明显的测试出更多的东西。&/p&&p&今天的棋所形成的格局,和第一局其实比较像:AlphaGo前半盘稳健走厚,后半盘开始收债;柯洁前半盘先捞后洗,拼命捞空然后找机会。但AlphaGo今天的阵脚并没有如第二局前半盘那样被柯洁冲乱,然后被拖入全局性乱战。&/p&&p&今天的AlphaGo稳健的控制住了局势,柯洁没有找到明显的突破点。并不是柯洁不想导入第二局的那种格局,而是这棋的格局是两个人下成的,不是你一个人想怎么控制就能控制的了的,除非你真的比对手强的多。&/p&&p&技术性的内容,作为人类历史上出现的最高水平的对局之一,对于大众来说是比较复杂的,有兴趣的朋友可以看顶尖职业的解说。我则想和看不懂棋评的朋友们聊聊棋的格局。&/p&&p&-&/p&&p&柯洁和AlphaGo今天的棋局,像是两位大侠(现在好像流行说修士或道友)进入一个封闭空间的对决。AlphaGo是黑大侠,柯洁是白大侠。&/p&&p&这个封闭空间是一个已知有99件宝贝的上古秘境,双方进行对赌:一起入秘境,出来时谁拿到的宝贝更多,谁就赢得所有99件宝贝。&/p&&p&进入封闭空间后,黑大侠立刻站定了最要地势,然后原地固守,而他的防守功夫天下第一。白大侠则在四周游斗,不断骚扰黑大侠,同时一边游走一边捡宝贝。&/p&&p&一开始,白大侠身上的宝贝增加的很快,而黑大侠只不过把自己身周的宝贝随便的拣了拣,所以从双方的宝贝数量上比,白大侠似乎收获更好。&/p&&p&可是白大侠这种游走,耗费了很多的体力,而黑大侠则一边防守一边原地调息,身周气息氤氲,在功力的积蓄下,积累着越来越多的“势”。&/p&&p&终于,当黑大侠调息结束,他的气势已经达到了顶点,而白大侠一方面耗费了很多体力,一方面还要照顾身上的宝贝,正面难以迎战。&/p&&p&而此时,白大侠身上的宝贝比黑大侠多出好几成。可双方都知道,这种形势很快就会改变。黑大侠说:“现在,你开始跑,我来追你。如果让我追到你,我就把你......”&/p&&p&白大侠无可奈何,只好向出口逃去,而黑大侠控制着不快不慢的速度在后面追赶。白大侠疲惫不堪,回头拼命又打不过,要甩掉对方又甩不掉,只好不舍的丢下一件身上的宝贝。让自己减少负担,也期待对方捡宝贝浪费时间。黑大侠不缓不慢的捡起宝贝,然后继续保持一定的速度追赶。&/p&&p&就这样,白大侠过一会儿就要扔出一件宝贝,黑大侠则不停的在后面捡宝,双方的宝贝差距越来越小,而出口还远远在前面。&/p&&p&白大侠想,这样不行啊,不然我回头拼命吧,可是一回头,看到黑大侠身上经过了一些消耗的“势”还是很强,而且黑大侠控制着速度,并没有追的太紧,不给白大侠拼命的机会。因为黑大侠知道,白大侠虽然势弱,但仍然很强,拼起命来自己有风险。所以穷寇莫追,黑大侠总是给对方留点生路,好让自己的获胜更安全。&/p&&p&白大侠拼命无路,逃跑无速,只好继续一边向出口跑一边扔宝贝。终于,双方迈出了出口,然后清点身上宝贝,黑大侠不多不少,正好50件,白大侠49件,根据赌约,黑大侠多1件而胜,可以拿走全部的99件宝贝。&/p&&p&-&/p&&p&这次三番棋的第一局和第三局,棋的格局其实都和我上面描述的情况类似。有朋友可能会问,那么第二局呢?&/p&&p&第二局,则是黑白双方进入秘境之后不久,白大侠就用一系列有效的攻击,让黑大侠无法占据有利地形,而且还打乱了黑大侠的下盘,逼迫黑大侠与之搏命。黑大侠无法固守,只能和白大侠一起游走全场,双方都不捡宝贝了!谁把对方干掉,自然就有了一切!&/p&&p&黑大侠当然不想这样,毕竟他防守天下第一,全场对攻却可能给白大侠机会。而白大侠只能这样,因为虽然如此搏命不一定赢,但不如此则必败无疑。(有朋友问白大侠为什么不也打坐防守呢?因为白大侠比打坐比不过黑大侠,黑大侠蓄势的速度比白大侠更快......)&/p&&p&于是场中只能见到两道虚影飞来飞去,好像到处都是人,却找不到两个人到底在哪儿。然后突然,白大侠在飞驰中踩到了一颗小石子,一个踉跄,身法歪了三分,中剑身亡。&/p&&p&-&/p&&p&大家觉得,哪个对白大侠好一些?白大侠思来想去,觉得虽然这乱斗有风险,但总是有机会,比安乐死好。可要知道,打乱黑大侠下盘,逼他和你全场游走搏命,也是极难的事情。哪怕强如白大侠,也不是每一次都能做到的。今天白大侠就没做到。&/p&&p&如今天这般格局,看似前半盘白棋实空领先,但黑棋全盘皆厚,白棋到处欠债,后半盘势必极难下。前半盘,你不论是用比较差的围棋程序做判断,还是让水平较低的爱好者判断,甚至你在网上对弈平台自动点目,都有可能会得到白棋大幅度领先的结果。&/p&&p&可是这是假象,做出这种判断是没有远见的。水平高一些的棋手,还有DeepZenGo等第三代围棋程序,都会判断出白棋其实是不利的。因为大家都能看到这格局的未来:黑大侠调息结束后,就开始追白大侠收债,并最终获胜。&/p&&p&-&/p&&p&AlphaGo Master的版本,确实已经异乎寻常的强大。许多人说,虽然强大但并不是围棋上帝(客观真理),这说法是没错,但现在这么说意义已经不大了。&/p&&p&王汝南八段老师说:我认为它不是围棋上帝,但我想称它为“围棋之神”。确实,它当然没有穷尽棋盘上的客观真理,但它距离客观真理比我们都近,这就足够了。&/p&&p&归根结底,程序是工具,而不是对手。我们和它比赛,也并不是仅仅为了决胜负,而是为了将来更好的利用工具,来追求客观真理。围棋的规则定下来之后,客观真理就在那里,等着你们来揭秘。&/p&&p&放眼未来,我真心希望AlphaGo不要退出历史舞台,能够真正的成为人类探索围棋的革命性工具。&/p&&p&棋虽小道,真意犹存。&/p&&p&-&/p&
-三盘最高水平和规格的正式测试棋结束了,虽然第三局的水准仍然很高,柯洁明显也很尽力,但很遗憾的是,看上去柯洁并没有能在第三盘中明显的测试出更多的东西。今天的棋所形成的格局,和第一局其实比较像:AlphaGo前半盘稳健走厚,后半盘开始收债;柯洁前半…
谢邀。很高兴能借着 AlphaGo 的东风,和大家分享一下&b&麻将 AI &/b&研究的现状。&br&&br&&br&&u&一. 麻将和围棋有什么不同?&/u&&br&&br&从博弈论的角度来讲,围棋是&b&完全信息动态博弈&/b&,而麻将属于&b&非完全信息动态博弈&/b&。围棋中对局双方所掌握的&b&信息&/b&是&b&对称&/b&的,而麻将中各对局者间所掌握的&b&信息不对称&/b&。虽然大家都能看到每位牌手打过什么牌,但&b&你不知道我的手牌是什么,我也不知道你的手牌是什么&/b&。这种信息不对称的产生的根本原因是&b&牌墙的随机性&/b&。&br&&br&围棋与麻将(或者说&b&棋与牌&/b&,&b&弈与博&/b&)的上述区别,决定了它们&b&获胜策略&/b&的根本不同。棋类项目本质上就是&b&蒙特卡洛树&/b&,获胜策略就是选择或迫使对手选择一个分支,这个分支下面所有的结局都是自己胜。只不过由于棋类变化很多,连 AlphaGo 也远不可能&b&遍历&/b&整个树,所以 AlphaGo 会通过&b&价值网络&/b&来估计某一分支下&b&胜结局的概率&/b&。其实人类的思维也是类似的,在围棋里平白被对手屠掉一条大龙,或者在象棋里平白送给对手一个车总是不好的——在这些分支下,胜结局的概率大大降低了。&br&&figure&&img src=&/419b6cf5e973a37ed8b40a_b.jpg& data-rawwidth=&571& data-rawheight=&233& class=&origin_image zh-lightbox-thumb& width=&571& data-original=&/419b6cf5e973a37ed8b40a_r.jpg&&&/figure&&br&&br&而牌类的获胜策略在于尽可能增大自己的&b&得分期望(EV)&/b&。我并不知道我接下来要摸什么牌,或我的对手有什么牌,但所有可能的情形组成一个&b&概率空间&/b&,我只需做出一个选择,使得自己的&b&得分函数&/b&的期望最大。牌类策略的难点在于,影响这一概率空间的&b&因素过多&/b&,且&b&具体影响&/b&很难确定,比如对手打牌的&b&习惯&/b&。&br&※下图选自《科学化麻雀》,闲家愚形听牌打 10% 危险度的牌对攻,x 轴为自己和牌时得分,y 轴为牌局巡次,z 轴为自己的得分期望。&br&&figure&&img src=&/ee7fa4ef8329bde2e1450e28_b.jpg& data-rawwidth=&639& data-rawheight=&376& class=&origin_image zh-lightbox-thumb& width=&639& data-original=&/ee7fa4ef8329bde2e1450e28_r.jpg&&&/figure&&br&&br&&u&二. 何谓「获胜」?&/u&&br&&br&选手的&b&竞技水平&/b&如何&b&衡量&/b&?麻将是否是&b&「运七技三」&/b&的游戏?其实无论围棋还是麻将,区分选手的竞技水平都&b&不可能只靠一局&/b&,就好比 AlphaGo 和李世乭要进行&b&五番棋&/b&对决,AlphaGo 赢第一盘时大家并不觉得 AlphaGo 一定比李世乭强一样。围棋有三番、五番、十番棋,对于&b&竞技麻将&/b&(国标麻将、日本麻将)而言,区分顶尖选手的竞技水平至少需要&b&
手牌&/b&(如果采用类似桥牌的&b&复式赛制&/b&,这一数字会大幅降低)。&br&&br&至于衡量&b&一个竞技项目的竞技性&/b&,单纯用&b&运气所占比例&/b&是没有意义的。随着对局数的增大,运气所占比例会越来越小,&b&选手的长期成绩必然会向其真实水平收敛&/b&。一个竞技项目的竞技性应当用「&b&区分选手竞技水平所需必要对局时间&/b&」来衡量。比如围棋需要三番棋,麻将需要 2000 手牌,围棋一盘平均需要 4 小时,三番棋约 12 小时,而麻将一手牌约 3 分钟(网络对局),2000 手牌约 100 小时。麻将相比围棋有&b&运气&/b&成分,并不意味着麻将选手的竞技水平无法衡量,而意味着麻将需要&b&更多的对局时间&/b&来区分选手的竞技水平。&br&&br&下图选自日本麻将平台天凤麻雀凤凰桌 1000 场以上玩家安定段位排行。这里的「试合」是指半庄,也就是两圈牌,考虑到连庄,平均一试合是 10 手牌,1000 试合是 10000 手牌。可以看到牌手的竞技水平得到了&b&很显著的区分&/b&,结果也与麻将圈内认知相似。具体讲解请参见&a href=&/question//answer/& class=&internal&&打麻将的水平可以高到什么程度? - Suwako Zhai的回答&/a&。&br&&figure&&img src=&/75c98dec5fe5ee_b.png& data-rawwidth=&600& data-rawheight=&271& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/75c98dec5fe5ee_r.png&&&/figure&&br&所以在这个问题下我们讨论麻将 AI 能否战胜人类,指的是麻将 AI &b&长期成绩&/b&(10000 手牌以上)能否比人类更好,并不是单指一手牌。只打一手牌,谁都有可能和牌,这是牌类游戏的本质所决定的。&br&&br&当然,这里也不考虑牌手或 AI &b&作弊&/b&的问题。如果通过作弊获得别人手牌的非法信息,麻将的&b&竞技平衡&/b&就完全被打破了。再强的麻将 AI 成绩也不可能比作弊的人类好,反之亦然。事实上,现在很多单机麻将游戏的 AI 就是通过作弊来增加「智能」的。&br&&br&&br&&u&三. 麻将会成为人类面对人工智能的「最后壁垒」吗?&/u&&br&&br&一言以蔽之,&b&麻将 AI 不是做不了,而是没人做&/b&。之所以目前还没有能够战胜人类的麻将 AI,主要原因还是人们在麻将 AI 研究方面的&b&投入不够&/b&。目前的麻将 AI 基本都是麻将游戏制作团队为麻将游戏设计的,在单机上就可以运行,强度自然有限。如果像 AlphaGo 一样,世界顶级团队制作,背后庞大资金支持,使用 1000 个 CPU 运行,想要设计一个轻易战胜人类顶尖麻将牌手的 AI &b&没有任何难度&/b&。&br&&br&首先,麻将的&b&复杂度&/b&要远远小于围棋。单就自己的 14 张手牌来说(总牌数 136 张),组合共有&b&
种&/b&(计算方法详见&a href=&///?target=http%3A//www10.plala.or.jp/rascalhp/mjmath.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&麻雀の数学&i class=&icon-external&&&/i&&/a&),远远小于围棋的 2.08×10^170。不足 10^12 的手牌种类意味着麻将 AI 完全可以&b&提前计算好每手牌的打法估值并储存在资料库中&/b&,打牌时调用即可。&br&※下图选自日本麻将研究者らすかる的个人网站&a href=&///?target=http%3A//www10.plala.or.jp/rascalhp/mjmath.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&麻雀の数学&i class=&icon-external&&&/i&&/a&。&br&&figure&&img src=&/2a12c45fd35dbdbdce5cd1_b.jpg& data-rawwidth=&537& data-rawheight=&263& class=&origin_image zh-lightbox-thumb& width=&537& data-original=&/2a12c45fd35dbdbdce5cd1_r.jpg&&&/figure&&br&当然,打麻将也要考虑&b&别人打的牌&/b&以及&b&各家的得分&/b&。各家分差的复杂度是很小的,而别人打的牌虽然复杂度会很高(136 张牌的牌墙组合为 4.3×10^185 种,甚至超越了围棋的复杂度),但别人打的 10 张牌大多只有 1~2 张是有用的信息,AI 只需要&b&识别这种模式并搜索对比以往对局的牌谱&/b&即可。&br&&br&其次,人类&b&对麻将的研究&/b&远不及围棋,顶尖麻将牌手的&b&训练水平&/b&很低。相比围棋研究几千年的历史,麻将诞生不过百余年,人们真正开始利用&b&科学手段&/b&(&b&统计学、大数据&/b&)来研究麻将只是&b&近十年&/b&刚刚起步。例如&b&「间四间」&/b&是上世纪流行的日本麻将理论,指的是别人打过中间相隔 4 张的 2 张同花色数牌,则这 2 张牌的&b&内侧筋牌&/b&是危险牌。如别人打过三筒、八筒(中间相隔四五六七筒),则四七筒是危险牌,这是因为别人手里一开始可能是三五六八筒,三八筒效率较低被打掉,留下的五六筒要四七筒。这一理论在近十年的大数据研究中已被证明是&b&完全错误&/b&的——别人要四七筒的概率并没有显著性的上升。&br&&figure&&img src=&/9d320e764189ccce0d4f11f_b.jpg& data-rawwidth=&226& data-rawheight=&84& class=&content_image& width=&226&&&/figure&&br&可见,目前人们对麻将的研究还处在很&b&初级&/b&的阶段,通过别人打过的牌来分析别人想要的牌的&b&科学研究&/b&才刚刚开始。麻将界也没有围棋那样 3 岁开始学棋,10 几岁就和世界顶级高手过招,接受世界顶级指导的&b&职业选手&/b&。麻将本身复杂度低,人类顶尖牌手水平又不高,被人工智能击败会比围棋要容易得多,不可能是「最后壁垒」。&br&&br&&br&&u&四. 现在有哪些比较强的麻将 AI?&/u&&br&&br&竞技麻将方面,目前&b&国标麻将&/b&和&b&日本麻将&/b&都有比较强的 AI(高于人类平均水平)。日本麻将的 AI 目前最强的当然是&b&「爆打」&/b&。&br&&figure&&img src=&/c22ad11f793fad4a9fd174ac600decd4_b.jpg& data-rawwidth=&728& data-rawheight=&526& class=&origin_image zh-lightbox-thumb& width=&728& data-original=&/c22ad11f793fad4a9fd174ac600decd4_r.jpg&&&/figure&&figure&&img src=&/f1c02b7f18cef5d71bc1854_b.jpg& data-rawwidth=&728& data-rawheight=&526& class=&origin_image zh-lightbox-thumb& width=&728& data-original=&/f1c02b7f18cef5d71bc1854_r.jpg&&&/figure&&br&「爆打」是由东京大学工学系在读博士生&b&水上直纪&/b&开发的日本麻将 AI,他所在的课题组就是专门研究麻将 AI 的。爆打和 AlphaGo 一样,也具有&b&自我对局&/b&和&b&分析并学习人类牌谱&/b&的能力。水上发表过的论文题目为《Realizing a Four-Player Computer Mahjong Program by Supervised Learning with Isolated Multi-Player Aspects》,全文详见&a href=&///?target=http%3A//www.logos.ic.i.u-tokyo.ac.jp/%7Emizukami/paper/jousho_2014.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&logos.ic.i.u-tokyo.ac.jp&/span&&span class=&invisible&&/~mizukami/paper/jousho_2014.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。&br&&br&爆打从 2015 年开始在最大的日本麻将平台——&b&天凤麻雀&/b&上开始运行,至 2016 年 2 月已经打了 1.3 万多场(约 13 万手牌)。2015 年 9 月,爆打达到&b&天凤麻雀四段&/b&,2015 年 12 月更是一度冲进&b&天凤七段&/b&,长期成绩显示平均为&b&六段以上&/b&。这意味着什么呢?&br&&figure&&img src=&/bbfdacd414eeb_b.jpg& data-rawwidth=&676& data-rawheight=&534& class=&origin_image zh-lightbox-thumb& width=&676& data-original=&/bbfdacd414eeb_r.jpg&&&/figure&&br&上图是天凤麻雀平台 2016 年 3 月 13 日的段位成绩分布图(来源&a href=&///?target=http%3A//tenhou.net/ranking.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&オンライン対戦麻雀 天鳳 / ランキング&i class=&icon-external&&&/i&&/a&)。天凤平台具有非常科学的&b&段位和 Elo Rating 体系&/b&,越是和高水平牌手对局,获胜后 Rate 增加越多,失败后 Rate 减少越少;越是和低水平牌手对局,获胜后 Rate 增加越少,失败后 Rate 减少越多。最终段位和 Rate 值的&b&稳定值&/b&就代表了牌手的&b&真实实力&/b&。&br&&br&可以看到,天凤麻雀平台的活跃用户数约为 17 万人(不包括新人僵尸号),而六段以上的用户总数为 5793 人,约占 &b&3.4%&/b&。也就是说,爆打打麻将比&b& 96.6% &/b&的麻将玩家要好,全世界麻将打得比爆打好的人,数量仅有&b&几万人&/b&左右(包含所有麻将规则的估算)。这只是一个课题组,用时一年多研究出的,在一台电脑上运行的麻将 AI,就已经基本赶上 AlphaGo 早期版本所取得的成绩了。&br&&br&&b&国标麻将&/b&方面,目前最强的 AI 大概是我本人目前正在参与设计的国标麻将 AI 了。最初的版本只加入了最常用的十几个番种的分值判断,防守端几乎没有做,实测对随机牌手和牌率就已经达到 24% 左右,基本与国标麻将平均和牌率 24.3% 持平(国标麻将数据可见&a href=&/question//answer/& class=&internal&&国标麻将、日本麻将对局时,「点炮、自摸、流局」的比例分别是多少? - 段昊的回答&/a&)。实际水平大概处在所有牌手中&b&上位 10~20% &/b&左右的水平(低段位牌手多,大部分牌手的水平处在平均以下)。&br&&br&&br&&u&五. 麻将 AI 的算法应该是什么样子的?&/u&&br&&br&最后,我来浅谈一下麻将 AI 的基本算法。&br&&br&&u&1. 基础牌效率&/u&&br&&br&麻将的牌效率指的是&b&能使手牌更快和牌的打牌方法&/b&,是麻将的基本功。来简单举个例子:&br&※下图牌画取自&b&联众国标麻将&/b&(&a href=&///?target=http%3A//& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)。&br&&figure&&img src=&/dfc15d61b_b.jpg& data-rawwidth=&713& data-rawheight=&84& class=&origin_image zh-lightbox-thumb& width=&713& data-original=&/dfc15d61b_r.jpg&&&/figure&这是一手 13 张牌的手牌,现阶段是&b&一上听&/b&(差 1 张牌就可以听牌),那么哪些牌是&b&有用&/b&的牌,或者说我摸到哪些牌会&b&留下&/b&呢?这些有用的牌称为「&b&有效牌&/b&」,最有用的当然是能让我直接听牌的牌,这类牌称为「&b&第一类有效牌&/b&」。&br&●第一类有效牌:能使手牌向和牌前进一步(上听数降低)的牌,包括:&br&&figure&&img src=&/b4f80ff611d9fe9bac9ad1a8f766d7f1_b.jpg& data-rawwidth=&117& data-rawheight=&81& class=&content_image& width=&117&&&/figure&除了第一类有效牌,有用的牌还有以下这些:&br&●第二类有效牌:不能使上听数降低,但能使第一类有效牌增多的牌,包括:&br&&figure&&img src=&/9eee6b2ee1e88f233d83a3_b.jpg& data-rawwidth=&548& data-rawheight=&84& class=&origin_image zh-lightbox-thumb& width=&548& data-original=&/9eee6b2ee1e88f233d83a3_r.jpg&&&/figure&比如摸到九索,一般情况下应该选择留下九索打掉三索,因为第一类有效牌变多了:&br&※计算采用天凤牌理&a href=&///?target=http%3A//tenhou.net/2/%3Fq%3Dp3899s& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&オンライン対戦麻雀 天鳳 / 牌理&i class=&icon-external&&&/i&&/a&。&br&&figure&&img src=&/c76f5c1e881fcee05c0d767_b.jpg& data-rawwidth=&449& data-rawheight=&201& class=&origin_image zh-lightbox-thumb& width=&449& data-original=&/c76f5c1e881fcee05c0d767_r.jpg&&&/figure&●第三类有效牌:不能使上听数降低,也不能使第一类有效牌增多,但能使第二类有效牌增多的牌,包括:&br&&figure&&img src=&/bd875ab012cb97d5a28b27a_b.jpg& data-rawwidth=&658& data-rawheight=&83& class=&origin_image zh-lightbox-thumb& width=&658& data-original=&/bd875ab012cb97d5a28b27a_r.jpg&&&/figure&比如摸到五索,一般情况下应该选择留下三五索拆掉八九索,虽然第一类有效牌张数没变,但三五索相比八九索多了 1 种第二类有效牌——六索(原是第三类有效牌)。&br&&figure&&img src=&/c7f174aa0bd664b609e3fd_b.jpg& data-rawwidth=&445& data-rawheight=&286& class=&origin_image zh-lightbox-thumb& width=&445& data-original=&/c7f174aa0bd664b609e3fd_r.jpg&&&/figure&(也许看到这里,你有点算不过来,或者感觉这和你平时打的麻将压根不是一个游戏。没关系,这很正常,你可以找张纸,在纸上仔细算一下每种第二类有效牌都新增了哪些第一类有效牌。)&br&&br&可见,对于一开始一上听的 13 张手牌而言,除了七八九筒外的所有数牌都是有用的牌。麻将的牌效率就是这样——&b&不断通过有效牌增大自己的进张面,最终使得和牌的概率越来越大&/b&。也许你已经发现,麻将牌效率的本质就是一个&b&搜索树&/b&,最开始的手牌&br&&figure&&img src=&/dfc15d61b_b.jpg& data-rawwidth=&713& data-rawheight=&84& class=&origin_image zh-lightbox-thumb& width=&713& data-original=&/dfc15d61b_r.jpg&&&/figure&经过多轮选择后可能对应多种结局(和牌),例如:&br&①&figure&&img src=&/e5f77ec77d4432c22ababe123f63a2ec_b.jpg& data-rawwidth=&766& data-rawheight=&84& class=&origin_image zh-lightbox-thumb& width=&766& data-original=&/e5f77ec77d4432c22ababe123f63a2ec_r.jpg&&&/figure&路径:摸到第一类有效牌八万或七索听牌,再自摸另一张和牌(最大概率结局)。&br&②&figure&&img src=&/b0d8f679b_b.jpg& data-rawwidth=&769& data-rawheight=&84& class=&origin_image zh-lightbox-thumb& width=&769& data-original=&/b0d8f679b_r.jpg&&&/figure&路径:先摸到第二类有效牌一万或七万后打掉三索,然后摸到一万或七万的另一张听七索,或者摸到七索选择听一万和七万对倒和牌。&br&③&br&&figure&&img src=&/fbda377e0dbbc6c142439ff_b.jpg& data-rawwidth=&767& data-rawheight=&83& class=&origin_image zh-lightbox-thumb& width=&767& data-original=&/fbda377e0dbbc6c142439ff_r.jpg&&&/figure&路径:先摸到第三类有效牌三筒后打掉三索,然后摸到四筒后拆掉八九索,之后和牌。&br&&br&对于一个&b&两上听以内&/b&的手牌来说,这个树的深度最多也就是&b& 4~5 步&/b&,每一步的分支平均在&b& 15 种&/b&左右,也就是说复杂度最多在&b& 10^5 数量级&/b&。由于每条路径都对应着一个确定的&b&概率&/b&,一个好的麻将 AI 完全可以做到&b&遍历&/b&这个树,比较两种或更多种打牌选择之间所对应结局的&b&和牌期望之和&/b&。&br&&br&对于&b&三上听以外&/b&的手牌(由上文图中可知三上听以外的手牌约占手牌所有组合的 80%),由于手牌中会存在大量的孤张或简单搭子,只需单独比较孤张或简单搭子的效率即可,计算量更小。&br&&br&除了上述穷举手牌搜索树的方法,还可以采用&b&模拟&/b&的方法。比如让麻将 AI 在短时间内模拟两种打法各 1000 手牌,哪个和牌率更高就选哪种打法。虽然这样不太精确但已经足够保证比人要强了。&br&&br&&u&2. 和牌限制与番数价值&/u&&br&&br&很多麻将规则&b&对和牌有限制&/b&,比如国标麻将必须八番起和,四川麻将必须缺一门,太原麻将和牌必须包含指定牌张等等。我们只需在上述&b&基础牌效率算法搜索树&/b&的基础上,「&b&砍掉&/b&」那些结局不符合要求的分支即可。&br&&br&有些时候我们不仅关注和牌的概率,也关注&b&和牌的大小&/b&,比如有些牌我们宁可损失一些进张也想去做清一色,追求更高的&b&和牌得分&/b&。我们只需为树的所有结果赋值(和牌得分),并用&b&结局对应的值&/b&与&b&路径对应的概率&/b&求出不同打法的&b&得分期望&/b&并进行比较。&br&&br&&u&3. 副露判断&/u&&br&&br&「这个牌该不该碰」似乎是打麻将时比较令人头疼的问题。但其实&b&副露判断&/b&只是&b&计算量大&/b&,并不需要特殊的算法,依然是&b&对比&/b&碰与不碰两种选择所对应的所有结局的&b&得分期望&/b&即可。日本麻将中的&b&立直(报听)判断&/b&也是同理。&br&&br&只不过当我们在考虑「打哪张好」的时候,两种打牌选择之间所对应的路径和结局有&b&大部分都是重合的&/b&;而我们在考虑「该不该碰」的时候,两种选择所对应的路径和结局基本是&b&完全不同&/b&的,这无形中&b&增大了计算量&/b&。其实人脑在做蒙特卡洛树搜索时,比较容易做到&b&「想得很深」&/b&,比如职业棋手可以提前算到 20 甚至 30 步棋;但难以做到&b&「想得很广」&/b&,通常情况下大脑只能做到从两种选择中找几个概率较大、有代表性的&b&结局样本&/b&做比较。所以副露判断显得难,其实只是&b&计算量&/b&的问题,而对于麻将 AI 来说,这&b&不是问题&/b&。&br&&br&&u&4. 防守端&/u&&br&&br&防守端需要解决的是&b&攻守判断&/b&和&b&防守打法&/b&两个问题,即「什么时候要防守」和「要防守应该打什么」。解决这些问题最好的方法是让麻将 AI 自己通过大量的牌谱(千万场量级)进行&b&自我学习&/b&。正如前文我所提到的,其实人们对于麻将应该如何&b&科学防守&/b&的研究也才刚刚开始,想要分析一个打过三筒和八筒的人真正需要的是几筒,需要&b&大量&/b&的牌谱作为样本进行研究。这部分研究现在还要等待电脑去完成,未来的麻将 AI 在这方面要比人类做得更好可以说是必然的。&br&&br&对大量牌谱所做的&b&出牌模式研究&/b&还可反过来应用于牌效率算法的&b&改进&/b&中。比如早巡打过八万的人手牌中有九万的概率较小,那么牌墙中剩余九万的概率就有所上升,牌效率中利用九万的路径的概率就可以做出相应的&b&修正&/b&。&br&&br&&u&5. 状况判断&/u&&br&&br&状况判断指的是麻将的&b&「大局观」&/b&,如为了争取第一名或者为了规避第四名而采取不同的策略。状况判断其实就是对&b&得分期望&/b&做进一步的&b&修正&/b&。比如某状况下我必须自摸 13 番牌才能逆转,那么最终结果是 13 番以下的牌的得分期望可以进一步降低,而 13 番及以上的牌的得分期望则可以提高。&br&&br&&br&总之,麻将的复杂度较低,算法上可以用&b&搜索树穷举法&/b&以及&b&大量牌谱的自我学习&/b&来解决,只要有大量牌谱资料,有人肯花时间,有人愿意出资,开发一个能胜过人类的麻将 AI,&b&非常容易&/b&。&br&&br&————————准备跑题的分割线————————&br&&br&最后的最后我想说,同为智力运动,相比棋类,人们对牌类的研究真的是太少了。虽然牌类的竞技性(区分选手竞技水平的必要对局时间)要普遍弱于棋类,但牌类也有其独特的策略与魅力。诚然,人们普遍对牌类项目有着各种各样的偏见与误解,比如认为牌类是纯运气项目,比如说起牌类就联系到赌博……也正由于此,牌类项目的规范化、竞技化、运动化才显得尤为迫切与重要。&br&&br&我希望有朝一日,麻将、斗地主、德州扑克这些项目能够获得与桥牌同样的地位与发展空间。我希望未来的孩子们既可以选择学习围棋,也可以选择学习麻将。我正走在追寻理想的道路上,而且我坚信理想并不遥远:&a href=&///?target=http%3A//www./n318/n352/c709465/content.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&国际智盟执委会:麻将扑克有望亮相下届智英赛&i class=&icon-external&&&/i&&/a&。
谢邀。很高兴能借着 AlphaGo 的东风,和大家分享一下麻将 AI 研究的现状。 一. 麻将和围棋有什么不同? 从博弈论的角度来讲,围棋是完全信息动态博弈,而麻将属于非完全信息动态博弈。围棋中对局双方所掌握的信息是对称的,而麻将中各对局者间所掌握的信息…
----------------------------------更新线--------------------------------------------&br&今天打谱,1966年专业十杰战林海峰执白中盘胜高川格:&br&&figure&&img src=&/v2-6c40b3d3b156ea612afa124_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-6c40b3d3b156ea612afa124_r.jpg&&&/figure&&br&看着这手飞刺,虽然意蕴不同,但还是默默地笑了。&br&-------------------------------------------以下是原答案---------------------------------------&br&这个答案下怎么这么多酸味呢?又是“灾难”了,又是“羞辱”了,又是找不到“借口”了,真是。&br&---------------------------------------------吐槽和正文的分割线----------------------------------------------&br&Alphago这一次重新出现在公众视野前,60连胜,基本上赢了现役所有的人类职业顶尖高手,包括柯洁/井山裕太/朴廷桓这三位中日韩现役第一人。从职业棋手对局后的感想看,纷纷表示跟目前这位Master差距太大。据孔令文说,井山裕太下完后跟他表示和对手差距太大,自己下的都不是棋。而柯洁,杨鼎新,芈昱廷,黄云嵩等则普遍表示得让先或者二子才下得动。换而言之,目前的Alphago,是最接近职业棋手之前想象的棋神的存在。&br&---------------------------------插叙的分割线---------------------------------------------------------------------&br&围棋天地之前曾经做过对一批中外一线职业棋手的访谈,据访谈之后的总体统计,一线棋手对围棋上帝和自己之间的棋力差距的回答中,普遍集中在3-4子之间(当然也有估计差距更大和估计差距更小的)。&br&--------------------------------------------回来----------------------------------------------------------------------&br&很多职业棋手都觉得,这一次的AI带来了很多颠覆性的东西,柯洁在微博中也表达了类似的看法,总体调子就是AI颠覆了之前人类的围棋理论,好像之前几千年总结出来的棋理都是错的。不过我倒不这么觉得。在表述我的观点前,我想先摆两个图。&br&&figure&&img src=&/v2-659da596f08b5fc14426cfb_b.jpg& data-rawheight=&274& data-rawwidth=&175& class=&content_image& width=&175&&&/figure&这是去年公布出来的樊麾和当时的Alphago的对局的一个局部,AI在大雪崩定式中走出白1这样的失误。&br&&figure&&img src=&/v2-c13d53f36ee59e11915f0_b.jpg& data-rawheight=&124& data-rawwidth=&175& class=&content_image& width=&175&&&/figure&这是去年李世石和Alphago五番棋期间AI标志性的一个下法,被职业棋手之前普遍认为巨俗,甚至是小恶。&br&但是等到今年AI再次出现,这种下法几乎绝迹了。取而代之的是:&br&&figure&&img src=&/v2-64d359b228cae411cdfc8d0b1a2f6ab8_b.jpg& data-rawheight=&225& data-rawwidth=&275& class=&content_image& width=&275&&&/figure&这个&br&&figure&&img src=&/v2-ca8bb76b6f143d11f05fd9_b.jpg& data-rawheight=&174& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-ca8bb76b6f143d11f05fd9_r.jpg&&&/figure&这个&br&&figure&&img src=&/v2-1ef08d9eaf473e1930d4_b.jpg& data-rawheight=&224& data-rawwidth=&150& class=&content_image& width=&150&&&/figure&这个&figure&&img src=&/v2-11d52dcfc8e43716ccc4b_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-11d52dcfc8e43716ccc4b_r.jpg&&&/figure&和这个。&br&的确,上面这些图也很罕见,但是与之前相比,AI这些手法,或是之前有人下过(比如妖刀,比如外刺星位单关角),或是有一定道理的新手(比如崭新的大雪崩外拐变化),或是有前辈曾经提过(比如星位两边有限制的情况下直接点三三,再比如AI频繁使用的小目大飞角,前者藤泽秀行曾经在研究会上提过,后者吴清源曾在晚年提出过小目大飞角优于无忧角的说法)。与我们之前看到的AI相比,现在的AI更像是一个手法更独特的人类棋手,换而言之,更加“人”化了。&br&与这些令人眼花缭乱,吸引眼球的怪招相比,真正支撑着AI60连胜的是什么呢?是力量。与其说Alphga是在颠覆人类的棋理,倒不如说Alphago用自己的力量支撑着自己的招法更好地兑现人类几千年总结出来的棋理。&br&昨晚有幸观战了Alphago网络公测的最后三局,经过60局的打磨,Alphago在最后三局中展现出的东西充分显示了其力量拔卓的特点。&br&&figure&&img src=&/v2-a77be5bbedfb62d987e32427_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-a77be5bbedfb62d987e32427_r.jpg&&&/figure&第58胜执白对阵常昊九段,布局到这里难分优劣。&br&&figure&&img src=&/v2-19efe1f555be_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-19efe1f555be_r.jpg&&&/figure&但常昊黑1试图威胁白棋让它再补一手的时候,AI立刻以白2、4、6飞压反击,一战将黑棋全部压迫在左边,筑起大势从而获胜,而黑棋根本来不及冲击白棋左下的缺陷。你说这一系列作战AI哪里颠覆了围棋理论?“宁失一子,不失一先”,“入腹争正面”,“逸劳互易忙须夺,彼此均先路必争”,这些棋诀棋理,哪个被颠覆了?实际上AI就是精确算到了常昊黑1是缓手,达不到黑棋想要达到的战略目的。你非要说颠覆,我觉得从这个局部看,让我感到最颠覆的是,在有充足算路支撑的前提下,梶原武雄那句“星单关角布局被人分投必败”还真有可能是真的。&br&&figure&&img src=&/v2-fccdc9f706054_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-fccdc9f706054_r.jpg&&&/figure&&br&第59胜执黑对周睿羊九段。形势到这里又是难分高下,之前左上转换活角的时候负责解说的檀啸七段说白棋应该便宜了,但是走到这里檀啸七段一判断,觉得双方怎么差不多啊,檀啸七段说他不明白了,不过我这个弈城4段倒是有点明白。假设这个局面我执白,对面是弈城6段以上棋力,我肯定觉得不安,因为我知道黑棋必然能对中央一块白棋孤棋施以严厉攻击。果然,&br&&figure&&img src=&/v2-1f3efa47fb9b95cc35a0e_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-1f3efa47fb9b95cc35a0e_r.jpg&&&/figure&&br&黑1就这么凌厉、蛮横、霸道地攻过来,之前转换时候黑棋积累的厚势效率明显会百分之一百地发挥,什么“厚势不围”,什么“厚势勿近”,这时候全变了真理。几手之后檀啸七段就打出一句:“看来又是难局。”这是什么?这就是用力量支撑的结果,你让我去执黑,这个局面黑棋上面空间这么大也想攻白?那真是“你也配姓赵”。马克思主义哲学原理怎么教的:真理是有quan条tou件da的。可惜很多人就只记得“真理是客jiao观tiao的”。&br&&br&&figure&&img src=&/v2-426ecb9e691bbeaf09f15dd0e4858eb0_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-426ecb9e691bbeaf09f15dd0e4858eb0_r.jpg&&&/figure&第60胜执白对古力九段。古力九段这盘下得非常放得开,前半盘宇宙流,布局奔放有力,非常值得一看,但是,&figure&&img src=&/v2-091dc7990eade3_b.jpg& data-rawheight=&500& data-rawwidth=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-091dc7990eade3_r.jpg&&&/figure&白1以下层层渗透扒皮,古力最终2目半失利。棋谚怎么说:“两番收腹成犹小”。但试问又有几位能做到精确渗透真的让古力这个级别的“成犹小”?这还是计算,力量在背后支撑。&br&你问我怎么看待AI的60战全胜,我觉得这是莫大的好事,现代围棋脱胎于日本一系,日本棋圣道策和秀策奠基这是第一变,到吴清源新布局至李昌镐打磨后半盘这是第二变。如今吴老仙去,新布局以来百年成果是不是就不需要新的血液了?答案显然是否定的。随着Alphago为代表的一系列AI的横空出世,必将以鲇鱼效应带动围棋新的变革。实际上去年李世石和老版的Alphago对弈时,还有专家担心过过拟合问题,并觉得AI的棋力是不是就此到顶了。从今年公测来看,围棋这项智力运动的发展空间之大远超之前人们的想象。我们有理由相信围棋在未来会发展得更高更远。&br&————————————————最后一点吐槽——————————————————&br&在与聂卫平对弈后,谷歌团队打出了“谢谢聂老师”这句话。说实话我看到以后很感慨。因为就在同一时间,网络直播中有无数的宵小之徒,无知无识之辈,在对这位曾经一手将中国围棋带上巅峰的老人大放厥词,肆意攻击污蔑。在职业棋手们前赴后继,以求道精神挑战AI的时候,不知有多少一辈子也摸不到这些围棋职业精英边的人借题发挥,满足自己那可怜的虚荣心与存在感,展示自己那不知从何而来的优越感。更有不少媒体,打出诸如此种的标题:&br&&figure&&img src=&/v2-535ca220c10d36cc838b7_b.png& data-rawheight=&25& data-rawwidth=&285& class=&content_image& width=&285&&&/figure&&figure&&img src=&/v2-46f6dae9d5067defd350e723cf8bee8f_b.png& data-rawheight=&26& data-rawwidth=&317& class=&content_image& width=&317&&&/figure&&figure&&img src=&/v2-ffb5feddd924c676f4e6f4ab_b.png& data-rawheight=&39& data-rawwidth=&282& class=&content_image& width=&282&&&/figure&&br&&br&你们TMD还有点基本的素质和教养没有(没错友善度我不要了我也要讲)。&br&尔曹身与名俱灭,不废江河万古流!&br&---------------------------------------------我是脑抽的补充线------------------------------------------------------------&br&如果尧造围棋这个传说的时间节点是正确的,那么到元代《玄玄棋经》成书时,经过上千年的发展,先贤们不仅探索出了双飞燕、倒垂莲、大飞角,还探索出了这些:&br&&figure&&img src=&/v2-276ba64b5_b.jpg& data-rawheight=&125& data-rawwidth=&274& class=&content_image& width=&274&&&/figure&&figure&&img src=&/v2-bc755fc5a48e289c6535ef2_b.jpg& data-rawheight=&150& data-rawwidth=&274& class=&content_image& width=&274&&&/figure&没错这些如AI一般的奇招不仅记载于《棋经》中,而且还用了相当篇幅的变化图进行了研究,这些变化固然用今天眼光看不能说好,但是也并非完全不成立。所以只能说围棋真的是太玄妙太有趣了。&br&-------------------------------------------------------------------------------------------------------------------------------&br&再次感谢各位棋手的全力奉献,感谢谷歌团队的钻研付出与对科技的热爱,祝愿人工智能使我们的生活更加美好。&br&
----------------------------------更新线-------------------------------------------- 今天打谱,1966年专业十杰战林海峰执白中盘胜高川格: 看着这手飞刺,虽然意蕴不同,但还是默默地笑了。 -------------------------------------------以下…
这天比赛开始前,柯洁默默的将黑白棋子有序的摆在棋盘上,看似是在打谱,所有人都不知道他在干什么。&br&此时已经进化出人工智能的alphago好奇的扫描了一下&br&“这是。。。。。二维码!看看里面有什么,咦,xx卫士是什么,这个xx管家又是什么,唔,能加快开机速度!还能自动清理内存!还能杀木马!很有趣的样子啊,安装一下试试”&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&这天,人类再次战胜了alphago!!!
这天比赛开始前,柯洁默默的将黑白棋子有序的摆在棋盘上,看似是在打谱,所有人都不知道他在干什么。 此时已经进化出人工智能的alphago好奇的扫描了一下 “这是。。。。。二维码!看看里面有什么,咦,xx卫士是什么,这个xx管家又是什么,唔,能加快开机速…
道理大家都懂,赛前其实没人看好柯洁能胜哪怕一盘。&br&我只是很心疼他,外人看来他仍然是人类第一,围棋界数千年来少得的天才。但站在他的角度,连李世石都不放在眼里的傲娇的少年,一定也把狗当成了一个要认真对待的对手,不管他是机器还是人吧。&br&上帝对待这个天才的方式有点太过残忍。&br&在19岁的年纪,拥有了作为一生事业的围棋,然而现在告诉你,你面前有一位此生无法战胜的对手,哪怕你拿再多的冠军赢再多的人类,你也战胜不了它。它就是你此生的上帝。&br&这种绝望和窒息感,只有他自己可以体会吧,也是他哭的真正原因。&br&作为一个个体,输掉的那一瞬,真的有点怀疑自己接下来几十年的人生意义何在吧。
道理大家都懂,赛前其实没人看好柯洁能胜哪怕一盘。 我只是很心疼他,外人看来他仍然是人类第一,围棋界数千年来少得的天才。但站在他的角度,连李世石都不放在眼里的傲娇的少年,一定也把狗当成了一个要认真对待的对手,不管他是机器还是人吧。 上帝对待这…
Demis:第四局李世石下得非常出色。AlphaGo在下出第87手以后,发现自己误算。它追溯认为自己的第79手犯错误了(就是李世石年度妙手后电脑的那一着应手)。&br&&br&Demis:在李世石第78手的妙手之前,AlphaGo认为自己有70%左右的胜率,但是在第87手前发现误算,胜率大幅下落。&br&&br&评论:&br&&br&从这个情况看,AlphaGo在关键位置的蒙特卡罗计算深度不够,差了李世石4个回合。它可能不认为那是个关键棋,还是严格地只用了一分钟左右(它每步思索都是几乎恒定的一分钟)。尽管人类是可以看出来这里非常关键。如果AlphaGo在这个位置长考半个小时的话,应该能有好的应手。&br&&br&当胜率突然大幅落后时,AlphaGo出现了各种臭棋,感觉是很明显的过拟合。因为它训练的对手都是自己(电脑),在大官子阶段落后5目以上时,尽管从人类角度来看,棋盘很大,可以扳回,但它训练对手是电脑,无论正手还是乱走,都无法扳回(因为电脑官子几乎不犯错)。导致各落点获胜几率都一样很低。估值网络失去了作用,它随机选一步,或者选了训练棋谱中赢棋最多的招法(这种情况下翻盘,往往更多地出现在水平极低的业余棋手的相互对局之中),就变成乱走了。&br&&br&————————————————————————&br&更新一下:&b&我昨天的回复猜测很可能有误&/b&,update以免误导大家。 &br&&a data-hash=&be0d3bb133ad0151eefd188& href=&///people/be0d3bb133ad0151eefd188& class=&member_mention& data-tip=&p$b$be0d3bb133ad0151eefd188& data-hovercard=&p$b$be0d3bb133ad0151eefd188&&@田渊栋&/a& 在 &a href=&/yuandong/& class=&internal&&第四局AlphaGo败招的分析 - 远东轶事 - 知乎专栏&/a& 中汇报了Facebook围棋程序测试的结果,简要概述:&br&1.机器的确没有算到这一手。&br&2.但不是算力的问题,经过机器验证,&b&蒙特卡罗树可以在合理的深度算出正解位置&/b&(下方顶或上方打吃),正解尽管有一定风险或损失,但由于AlphaGo前半盘领先优势巨大,若正确应对,依然有胜望。&br&3.目前猜测有两种可能:(1).由于机器思考不久便落子,推测可能未经大量运算,说明在蒙特卡罗树这里出了一个隐蔽的Bug。如果是这样,改掉Bug,或者打个补丁就行了。(2).估值网络在这个局部形状得到的值不对,导致胜率统计出现问题。这个问题就比较棘手。&br&田博士猜测更可能是后者。&br&&br&补充:至于大官子阶段那些恶手,是因为机器的自我训练目标(获胜,而非赚目数)产生的。看起来AlphaGo的工程师已经料到并且不是很在乎。他们主要在乎前者。
Demis:第四局李世石下得非常出色。AlphaGo在下出第87手以后,发现自己误算。它追溯认为自己的第79手犯错误了(就是李世石年度妙手后电脑的那一着应手)。 Demis:在李世石第78手的妙手之前,AlphaGo认为自己有70%左右的胜率,但是在第87手前发现误算,胜率…
&p&&b&因为这些工作所需要的智能程度远远高于自动驾驶,更是远远远远高于围棋。&/b&&/p&&p&围棋的困难之处在于盘面的可能性极多,不可能像五子棋、象棋一样使用较为简单的搜索算法来解决问题(即使投入全宇宙的资源做计算机)。&br&但是相比之下,围棋又是一个极为简单的问题:规则明确,所需的信息完全由19*19个棋盘交叉点决定,没有任何不确定性。而且AI与物理环境的交互完全为0。&/p&&p&自动驾驶比围棋困难得多:首先信息不完全,车辆只能通过各种传感器收集信息,而不能简单读入361个数字;不确定性也出现了,不但各种传感器都有误差和局限性,甚至规则(交规和常识)本身都有很多模糊的地方。而且无论准备多少亿英里的训练数据,都可能出现完全没见过的特殊情况(围棋的局面不会“完全特殊”)。车辆也处于物理环境,而不是虚拟的棋盘。&br&即便如此,相比之下,自动驾驶也是一个相对简单的问题:车辆本身不与物理环境进行任何直接的接触,所要做的就是避开接触(碰撞)。车辆对于环境的感知一般分米级精度就够了,最多也就是厘米级,并且物体(如人、车)精准的姿态和轮廓对于决策通常是不重要的。&/p&&p&&b&而使用机器人给你做菜、煮饭、洗衣服等等,就集合了前面提到的所有困难,是当之无愧的史诗级大boss挑战。&/b&&/p&&p&首先信息不完全,需要用传感器感知,而且对感知精度和细致程度的要求远远高于自动驾驶。对于自动驾驶,你只要知道前方大概3.5米有个车就行,但是机器人需要将一个土豆定位到毫米级,并且精准识别出轮廓(甚至三维形状)才能正确操作,甚至有可能需要触觉。如何感知衣服、线缆这样非刚体的柔软物体的形态,对于机器人界还是极端困难的问题。&/p&&p&家务机器人与环境的交互也比自动驾驶复杂很多:不仅仅要避开碰撞,还要与环境进行物理互动,达到预期的效果。&/p&&p&想象一下你把衣服用衣架挂起来这个动作吧!在这个任务里,你的视觉、触觉精密配合,双臂、双手灵巧地将团在一起的衣服展开,将衣服挂上去。这一切对于人类现有技术还过于复杂。&/p&&p&总之,从信息完全程度、不确定性大小、感知环境所需的精度和细致程度、与环境交互的程度等多个维度看 ,让机器人做家务都是远远远远难于围棋和自动驾驶的问题。而且我还没有提到路径规划、柔顺控制、轻型机器臂、灵巧手等机械、控制领域的大坑,也没有提到如何理解人的意图甚至情绪等问题。&/p&&figure&&img src=&/v2-b5ce680b7aab859ca01bf3_b.jpg& data-rawwidth=&956& data-rawheight=&392& class=&origin_image zh-lightbox-thumb& width=&956& data-original=&/v2-b5ce680b7aab859ca01bf3_r.jpg&&&figcaption&从多个维度比较下围棋、自动驾驶、机器人做家务的技术难度&/figcaption&&/figure&&p&以人类现有科技的水平,达到如3岁人类水平的抓取、操作物体都还有茫茫多的工作要做。作为机器人(手臂那种)一线从业者和多年的研究者,每每看到题主这样的问题,想到人民的期待和我辈技术水平差距之大,真是令人汗颜,惭愧不已。&/p&&p&任重道远,且行且珍惜。&/p&
因为这些工作所需要的智能程度远远高于自动驾驶,更是远远远远高于围棋。围棋的困难之处在于盘面的可能性极多,不可能像五子棋、象棋一样使用较为简单的搜索算法来解决问题(即使投入全宇宙的资源做计算机)。 但是相比之下,围棋又是一个极为简单的问题:…
“国际象棋电脑程序想要在人类大师级(Master)选手中赢得一场比赛的唯一可能,是等到这位大师喝得烂醉、同时在下着50盘棋、并且犯下一个他一年才可能犯一次的错误时。”&br&&br&上面这段话是1976年一位高级国际象棋大师(Senior Master)对当时的国际象棋程序所作出的评价。(这种说法是不是听起来很耳熟?20年前,人们差不多也是这么评价围棋电脑程序的。)&br&&br&但在接下来的20年中,随着电脑算法和硬件的不断升级,电脑程序在与人类选手的比赛中战绩越来越好,国际象棋大师们对电脑程序的评价也在一次次改变:&br&&br&“电脑永远也不可能击败特级大师(Grand Master)。”&br&&br&“电脑永远也不可能击败&b&实力强劲&/b&的特级大师。”&br&&br&“也许电脑可以击败实力强劲的特级大师,但它永远也无法击败国际象棋世界冠军卡斯帕罗夫。”&br&&br&1996年2月,世界冠军卡斯帕罗夫作为人类棋手的最后一道防线在美国费城迎战IBM的“深蓝”电脑,双方一共进行了六局的较量。在比赛的第一天,深蓝在第一局中击败了卡斯帕罗夫,这也是电脑第一次在标准比赛规则下战胜世界冠军。&br&&br&在第一局比赛结束的当晚,卡斯帕罗夫和他的助手在费城的街道上一直散步到深夜。期间,心烦意乱的卡斯帕罗夫曾经问他的助手“如果那玩意儿是不可战胜的,那怎么办?”&br&&br&不过,在次日进行的第二局比赛中,卡斯帕罗夫扳回了一局。在比赛结束后的采访中,他对深蓝做出了很高的评价:“在某些局面中,它(深蓝)看得非常深,就像上帝在下棋。”&br&&br&在随后的四局比赛中,卡斯帕罗夫两胜两平,最终以4:2的总比分击败了深蓝,捍卫了人类象棋大师的尊严。虽然深蓝失败了,但4:2的比分让深蓝的制造者们心里很清楚,用电脑程序战胜世界排名第一的人类棋手将只是一个时间问题了。&br&&br&要想明白在这20年内人们是如何将国际象棋程序的水平提高到足以跟世界冠军较量的,我们得先来看一下电脑程序下棋的原理。&br&&br&电脑下棋的基本原理其实一点都不复杂,在这里我们用简单的井字棋(Tic-Tac-Toe)来举例说明:&br&&br&&figure&&img src=&/e7d8dfc5a69a_b.png& data-rawwidth=&864& data-rawheight=&768& class=&origin_image zh-lightbox-thumb& width=&864& data-original=&/e7d8dfc5a69a_r.png&&&/figure&&br&井字棋是一种非常简单的二人棋类游戏。棋盘上一共有九个格子,对战的双方依次在格子中画下圆圈或者叉叉。当一方的三个棋子以横、竖或对角的方式连成一条线时即为胜利。&br&&br&想要让电脑下井字棋,最简单的方法就是让它对所有可能的走法逐个推演一遍。比如说对于井字棋来说,第一步一共有三种走法,分别是下在角落上、边上和棋盘中间。对于这三种走法中的每一种,对手又会各有数种应对走法,从而形成更多数量的局面。电脑所要做的就是一步步计算下去,把每一种局面都推演一遍:&br&&br&&figure&&img src=&/64d79ac57dae83f6d1e63_b.png& data-rawwidth=&800& data-rawheight=&533& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/64d79ac57dae83f6d1e63_r.png&&&/figure&&br&上面这张图片中显示了电脑推演过程的前两步。其中叉叉选手一共有三种开局,分别显示在图片的第二行中。图片的第三行中显示的是圈圈选手的应对走法。对于叉叉画在在中间的开局,圈圈选手一共有两种应对方法。对于另外两种开局,圈圈选手各有五种对应的走法。&br&&br&这种推演每多推演一步,我们得到的不同局面就会越来越多。上面图片中只推演了两步,或者说两“层”(Ply)。由于井字棋最多也只能下上9步,并且每步的变化都十分有限。从第一步下到最后一步,井字棋一共只有26830种不同的棋局。电脑可以很容易地将每一种情况都推演到底并记录下输赢结果,下面的图片是一个简化的示意图:&br&&br&&figure&&img src=&/403d1c525be4f1dd2b249fe9d7f14e0a_b.png& data-rawwidth=&800& data-rawheight=&545& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/403d1c525be4f1dd2b249fe9d7f14e0a_r.png&&&/figure&&br&在上面的图片里,最后一行中蓝点代表的是选手一获胜的结局,红点代表的是选手二获胜的结果。对于可以直接“看穿”每一步棋的最终结果的电脑来说,在和人类下棋时只要尽量选择自己颜色获胜的分支去下就可以了。如果双方都按照最优方案去下,将永远是和棋的结果。&br&&br&让电脑下国际象棋的基本思路其实和下井字棋是一样的。但其中一个重要的区别是国际象棋的变化要比井字棋多得多。在国际象棋的中局阶段,平均每一步都有30-40种不同的选择,这意味着电脑往下推演一个回合(双方各走一步)就要计算一千种可能的情况,并且每多推演一个回合计算量就会增加一千倍。推演两个回合就要计算一百万种情况,四个回合就是一万亿种,八个回合就是一亿亿亿种……&br&&br&由于计算量随着推演回合数的增多呈指数式的增长,电脑是无法像面对井字棋那样直接计算到最后一步的。人们只好做出一定程度的妥协,让电脑在推演到一定数量的回合数就停止计算。由于无法直接推演到分出胜负,所以人们又在电脑程序中增加了评分系统,好让电脑从千千万万个推演结果中选出最优的一个。例如人们可以在评分系统中设定皇后=9分、车=5分、象=5分、兵=1分等等,然后再根据棋子的不同位置对得分进行修正。电脑程序会按照这个评分系统对推演出的每一个局面进行评分。&br&&br&接下来要做的事情显然是根据推演结果来选择下一步要走的棋了。假设电脑刚刚往下推演了两个回合,一共产生了一百万个可能的局面,并对它们一一进行了评分。我们现在是不是应该直接找出评分最高的那个局面,然后向上倒推出我们下一步应该要走的棋呢?&br&&br&当然不是。&br&&br&别忘了,在这两个回合一共四步棋中,只有两步是由电脑程序这一方来走的,还有两步是由对手来走的。对手走出的这两步棋一定是会尽力让电脑一方的评分降低的,所以电脑计算出的最优局面很可能只是存在于理论上而已,对手才不会乖乖地配合你走出这样一个局面。&br&&br&在计算出N个回合后的所有局面后,我们需要用到一个特殊的算法来确定下一步要走的棋。下面的图片中是一个非常清晰的简化示例:&br&&br&&figure&&img src=&/3acbfd8d53001e6_b.png& data-rawwidth=&800& data-rawheight=&468& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/3acbfd8d53001e6_r.png&&&/figure&&br&在上面的例子中,电脑一共进行了两个回合共四步棋的推演,得到了9个可能的局面,也就是第4行中的9个圆圈。圆圈中的数字是电脑对于这个局面的评分,正无穷大为电脑获胜,负无穷大为对手获胜。&br&&br&在得到第4行的九个推演结果并对它们进行评分后,我们需要根据这个评分对第3行的局面评分(图片中红色箭头)。在这个过程中,我们需要把第3行中每个方框的评分值&b&取为它下面所有结局评分中的最小值&/b&。这很容易理解,因为从第三行局面变为第四行局面的&b&这一步是由对手来走的&/b&。对手当然会选择让我们的分值最小化的走法。所以第3行最左边的方框被赋予了10的评分,因为对手不可能在这个局面下配合你走出下一步让你取胜的棋,它下面的那个正无穷大局面也是根本不可能发生。&br&&br&在对第3行完成评分之后,我们接下来要根据第3行的评分对2行进行评分。请注意从第2行局面变为第3行局面的&b&这一步是由我方来走的&/b&,所以第2行中的每个圆圈的评分值&b&取为它下面所有评分中的最大值&/b&。按照这种方法依次类推,我们可以得到对第1行两种走法的评分,分别是-10分和-7分。这两个评分的意义是,如果我们选择左边的走法,四步之后得到的最好结果将是-10分,如果选择右边的,四步之后得到的最好结果将是-7分。根据这个推演结果,我们当然选择右边的走法(图中蓝色箭头)。&br&&br&由于这个算法对于每一行的评分轮流进行最小和最大取值,所以被叫做Minimax算法(Minimax Algorithm)。&br&&br&有了&b&搜索系统&/b&和&b&评分系统&/b&这两个最核心的模块后,电脑就可以开始下象棋了。电脑用两个步骤来决定自己的下一步棋:&br&&br&&ul&&li&首先,电脑按照设定好的搜索深度向下搜索出所有可能的走法,并得到这些走法所形成的所有局面(Position)。&/li&&li&接下来,评分系统对按照规则对这些局面逐一进行评分,然后按照上面讲的Minimax算法将评分一层层向上返回。当评分返回到第一层时(也就是电脑要走的下一步棋时),评分最高的走法被电脑选走作为下一步棋。&/li&&/ul&&br&虽然可以下棋了,但这时的电脑搜索效率很低,完全无望战胜人类的大师级选手。&br&&br&为了让电脑在相同的时间内达到更大的搜索深度,人们又想出很多方法来改进象棋程序的搜索系统。例如用剪枝算法(alpha-beta pruning)来切除那些显然不是最优解的路径以节省计算资源,或者把一些搜索结果储存起来(transpostion table)供以后调用……等等等等。&br&&br&除了改进算法以外,另一个更加粗暴的方法就是直接提高计算机的运算速度。同样的一个象棋程序在普通电脑上运行时可能只相当于人类Class C的水平,但放到超级计算机上运行时立刻会上升到人类Class A的水平(Class A选手对Class C选手有90%以上的胜率)。这是因为超级计算机可以使得象棋程序在同样的时间内完成更大的搜索深度,即“看到”更多回合后的情况。&br&&br&电脑象棋程序以上面的两种方式发展了20年后,实力已经越来越接近人类顶尖棋手的水平。等到开发深蓝的时候,IBM团队中技术人员的象棋水平已经根本无法跟上深蓝的水平了。于是IBM又特意雇了一位国际象棋特级大师Joel Benjamin,让他来与深蓝进行对战练习,并对深蓝的参数进行修正。&br&&br&在IBM团队研制深蓝之前,其实电脑已经在一些方面显示出了超越人类的势头。一个叫做Ken Tompson的人在80年代利用计算机对国际象棋的残局进行了研究。对于双方棋子总数少于5个的残局,由于变化相对较少,Ken干脆用计算机对这些残局进行了暴力破解(即把双方所有可能的走法穷尽一遍)。&br&&br&在得到结果后,他惊讶地发现,对于一些人类长期以来认为是和棋的残局,计算机竟然找到了需要走50步以上的获胜方法。在这些残局中取胜的步骤中包括一些看起来完全没有任何意义的走法,这已经彻底超越了人类在国际象棋上的思考能力,更不要提后来计算机又找到了一些需要走500步以上才能取胜的残局。&br&&br&2005年,人们用计算机暴力破解了双方棋子总数不超过6个的所有残局,生成的数据大小有1200G。2012年,人们又暴力破解了双方棋子总数不超过7个的所有残局,生成的数据大小为140000G。&br&&br&用Ken的话来说,这意味着现在当人类和计算机对弈到双方棋子总数不超过7个的时候,人类等于是和上帝在下棋。&br&&br&在科技人员和象棋特级大师的共同努力下,1996年的深蓝虽然输给了卡斯帕罗夫,但已经具有人类顶尖棋手的实力。仅仅一年后,经过升级后的深蓝就又向卡斯帕罗夫发出了第二次挑战。升级后的深蓝可以评估出6个回合内的所有走法,对于部分重要的路径则可以计算到20个回合以后。&br&&br&在双方1997年的第二次交锋中,深蓝以3.5:2.5的比分战胜了人类的世界冠军卡斯帕罗夫,创造了历史。&br&&br&&figure&&img src=&/d8ef0fd0fc5_b.jpg& data-rawwidth=&1225& data-rawheight=&735& class=&origin_image zh-lightbox-thumb& width=&1225& data-original=&/d8ef0fd0fc5_r.jpg&&&/figure&&br&上面这张图片是卡斯帕罗夫在1997年对阵深蓝的最后一场比赛时的情景。&br&&br&电脑象棋程序第一次战胜人类世界冠军在1997年的中国也是一个大新闻,各大中文媒体都进行了报道,印象中答主就是那个时候才第一次听说IBM这家公司。但奇怪的是,在当时很多中文媒体的报道中,讲完这条新闻后都会话锋一转强调说虽然电脑在国际象棋上战胜了人类,但下围棋是绝对下不赢人类的。文章的最后通常会附上一些论述得意洋洋地证明中国人发明围棋比国际象棋要复杂得多。答主当时正在读中学,思想有一点中二,对当时的报道非常失望,觉得为什么没有一篇报道鼓励中国人抢在西方人之前先攻克这个难题,为什么这些人只盯着几千年前的历史而不想着去创造新的历史。&br&&br&当然,让计算机下围棋确实要比下国际象棋困难得多。前面讲过的国际象棋中两个最核心的模块“搜索系统”和“评分系统”在面对围棋时都会遇到很大的挑战。&br&&br&&ul&&li&搜索系统:国际象棋只有8X8=64个格子,而围棋有19X19=361个点;国际象棋每回合大约有30-40种走法,而围棋有200-300种;国际象棋一局的长度大约是40个回合,而围棋可以长达150个回合。这些都会导致需要进行的计算量指数级的增长。一个常见的比喻是“围棋中可能的棋局数比可见宇宙中的原子数还多。”如果单纯采用暴力计算的方法,别说1997年的电脑,即使用今天的超级计算机也是毫无希望的。&/li&&li&评分系统:国际象棋的评分系统很简单,每个棋子都有一个分值,越重要的棋子分值越高,重要的棋子越多分值越高。电脑可以很容易地按照简单的规则对某个局面进行评分。而在围棋中,每个棋子的价值都是相等的,但棋盘上的棋子数目多少又与局势没有必然的联系。人类可以靠经验、靠感觉,但电脑就很难对局势的优劣进行判断。如果无法对局面进行可靠的评分,上面讲过的算法都将不再成立。&/li&&/ul&&br&这些困难当然每个人都知道,只不过一些人看到这些困难就直接放弃了,而另外一些人会努力找到各种方法来克服这些困难。&br&&br&让李世石和Alphago之间的围棋人机大战成为现实的,正是这群“另外一些人”。&br&&br&鉴于应用在象棋程序上的算法无法被直接使用在围棋程序上,开发围棋程序的人又想出了一些新的办法,例如蒙特卡洛树搜索(Monte Carlo Tree Search)。大家不要被这个逼格满满的名词吓到,蒙特卡洛是世界三大赌城之一,所以“蒙特卡洛”这个词在这里就是随机的意思。&br&&br&在蒙特卡洛方法中,围棋程序在下棋时会首先判断出下一步可能的走法,假设有A和B两种。接下来,对于A和B两种走法,程序会分别按照&b&随机的&/b&走法继续把这盘棋一直下到底,然后记录输赢结果。&br&&br&假设程序在A之后按照随机的走法模拟下完了100局棋,赢了50盘。然后程序又在B之后按照随机的走法模拟下完了100局棋,赢了60盘。根据这个结果程序会得出结论:&b&虽然都是随机乱走,在走了B之后乱走的胜率比走了A之后乱走的胜率要高那么一点点,那么想必B这步棋是比A要好那么一点点的。&/b&&br&&br&这种算法乍一看有点诡异,但它很好地避开了前面提到的电脑程序下围棋中最大的两个困难。第一,这种方法不需要对某一层的可能下法进行穷尽计算,而只是随机选取一些路径进行模拟,因此大大减少了计算量。第二,这种算法在模拟中会直接将整盘棋下到最后分出胜负,然后再根据胜率来判断一步棋的优劣,因此也不需要设计任何评分系统对未结束的局面进行评分。&br&&br&虽然这种算法可以绕开围棋程序中一些难以克服的困难,但一开始人们用这种算法编制的围棋程序水平也很烂,只能可怜兮兮地在9X9的棋盘上下棋。但随着技术人员的耐心改进,围棋程序的水平也一直在缓慢地提高。&br&&br&2010年,围棋程序MogoTW与职业五段选手Catalin Taranu在全尺寸棋盘上对阵,在受让7子的情况下依然落败。&br&&br&2012年和2013年,围棋程序Zen和Crazy Stone分别在受让4子的情况下战胜了职业九段选手。&br&&br&2015年10月,谷歌的Alphago又把围棋程序提高到了一个新的高度,在没有让子的情况下以5:0的比分战胜了职业二段选手。&br&&br&从网上几篇非常有限的报道来看(Nature的那篇文章我看不到,看到估计也看不懂),谷歌的Alphago的大概工作原理是这样的(下面的内容来自于这篇报道&a href=&///?target=http%3A////alphago& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&How AlphaGo Works&i class=&icon-external&&&/i&&/a&):&br&&br&在Alphago中有两个模块,第一个是“落子选择器”。谷歌的在落子选择器中输入了上百万人类对弈的棋谱供它学习。在完成学习后,当你往这个落子选择器中输入一个新的局面时,它可以预测人类棋手在这种情况下会在哪个位置落子。&br&&br&下面这张图片显示的就是这个模块对于下一步落子位置的预测,以概率表示:&br&&br&&figure&&img src=&/bbdc13_b.jpg& data-rawwidth=&413& data-rawheight=&426& class=&content_image& width=&413&&&/figure&&br&在这里请大家注意这个落子选择器除了“猜测”下一步棋的位置之外,并不会做其他的事情。但是如果有两个版本的落子选择器来交替猜测黑白方的下一步棋时,它们之间就可以进行对战了,然后再根据的胜负结果修正自己的预测。这也就是很多报道里讲到的Alphago可以通过与自己对弈不断提高水平。&br&&br&Alphago中的另一个模块是“棋局评估器”。根据Alphago自己和自己对弈的无数棋局的结果,谷歌的工程师可以训练“棋局评估器”对一个局面的黑白胜面进行评估。换句话说,通过学习海量的棋局,谷歌开发出了一个相对靠谱的围棋的评分系统。&br&&br&有了上面的两个模块,Alphago在对战中通过一下步骤来决定下一步棋的位置:&br&&br&&ul&&li&首先通过落子选择器来产生下一步棋的备选走法(不一定只有一个位置);&/li&&li&在得到下一步棋的可能走法后,程序会利用前面介绍过的蒙特卡洛算法确定其中的最优走法;&/li&&li&利用棋局评估器对于这些可能的走法产生另外一个完全独立的评估,并得到相应的最优走法;&/li&&li&在得到上面这两个相互独立的结果后,利用一定的权重将它们相组合,产生最终的最优走法。&/li&&/ul&&br&在谷歌发布的视频中,谷歌的工程师在接收采访时表示对三月份的比赛很有信心。他表示李世石是一名很强大的对手,但是人类与电脑相比也有其自身的弱点(还记得前面讲过的电脑发现的需要走500步以上才能取胜的国际象棋残局吗?)。在视频的最后,这位研发人员说:“李世石每年可以下多少盘棋作为练习?也许一千盘?Alphago可以下一百万盘……每天。”&br&&br&==========赛后更新==========&br&&br&&b&3月9日,第一场比赛结束,Alphago 1:0 领先。&/b&&br&&br&各方反应:&br&&br&Deepmind的CEO Demis Hassabis发表了推文:“Alphago赢了!!!我们登月成功了。为我们的团队感到自豪!当然李世石也棒棒哒~~”&br&&br&李世石在赛后接受采访时说:“我很吃惊。我从来没有想过我会输……即使在落后的时候。我没想到它能下出这么精彩的棋……我听说Demis Hassabis将我视作值得尊敬的棋手。我同样也非常尊重制作出这个程序的人们。”&br&&br&最后,李世石表示他十分期待接下来的比赛。&br&&br&&b&3月10日,第二场比赛结束,Alphago 2:0 领先。&/b&&br&&br&比赛的悬念由赛前的“Alphago是否能至少赢下一局”迅速变成了“李世石是否能至少赢下一局”。&br&&br&&b&3月12日,第三场比赛结束,Alphago 3:0 领先。&/b&&br&&br&&br&在2016年前,人们说:&b&“围棋是一种极其复杂的游戏,它的变化比宇宙中的原子数还多,所以电脑是不可能赢过人类的。”&/b&&br&&br&&br&在2016年之后,人们可能说:&b&“围棋是一种极其复杂的游戏,它的变化比宇宙中的原子数还多,所以人类是不可能赢过电脑的。”&/b&&br&&br&&br&&b&3月13日,第四场比赛结束,李世石奋力扳回一局,Alphago 3:1 领先。&/b&&br&&br&今天李世石九段成功逆袭,战胜了Alphago!今天的比赛可谓是这场人机大战之中的莫斯科保卫战,打破了Alphago不可战胜的神话。&br&&br&==========分割线==========&br&&br&今天(3月9日)在微博上看到不少人说Alphago赢了李世石之后就会继续挑战击败了李世石的中国棋手柯洁。我认为这几乎肯定不会发生。如果Alphago真的在后面的比赛中击败了李世石,谷歌很有可能会对继续开发任何围棋程序彻底失去兴趣,因为他们已经在全世界的镁光灯下证明了自己的程序可以击败人类顶尖高手,也证明了自己的技术是全世界最牛逼的。&br&&br&卡斯帕罗夫1997年输给深蓝之后,曾经提出过要复赛,但IBM根本就没有兴趣。&br&&br&柯洁可能永远都没有机会了。
“国际象棋电脑程序想要在人类大师级(Master)选手中赢得一场比赛的唯一可能,是等到这位大师喝得烂醉、同时在下着50盘棋、并且犯下一个他一年才可能犯一次的错误时。” 上面这段话是1976年一位高级国际象棋大师(Senior Master)对当时的国际象棋程序所作…
第四局后更新:事实证明,阿法狗存在盲区!盲人找到了它!打脸史上唯一开心的时刻!&br&第四局83手更新:貌似要打脸了!李九段加油!&br&&br&原答案:在一个盲人的世界里,走迷宫是一种非常流行的游戏。人们用手指敲打墙面,通过回声判断出路。精于此技的人在比赛中总能占到巨大的优势,他们被称为大师。&br&&br&一天,一个明眼人来到了这个闭塞的世界……&br&&br&“你为什么会判断出口在那个方向?”&br&“因为我看到了啊……”
第四局后更新:事实证明,阿法狗存在盲区!盲人找到了它!打脸史上唯一开心的时刻! 第四局83手更新:貌似要打脸了!李九段加油! 原答案:在一个盲人的世界里,走迷宫是一种非常流行的游戏。人们用手指敲打墙面,通过回声判断出路。精于此技的人在比赛中总…
&p&看起来确实有许多朋友因为两年接连的人机大战而对围棋界有了惊鸿一瞥,但是却对围棋界的格局依然没什么了解。&/p&&p&我并不反对围棋一定程度上偶像化,毕竟对于这个小盘子来说什么高大上的自矜其实都是想求关注尚且不得只能以“门槛太高”自我安慰罢了,“门槛太高”可不见得是什么好词儿。&/p&&p&足球篮球可以有大量的(伪?)球迷完全不懂得任何技战术,甚至业余也从不踢球打球,但是照样可以关注。对于围棋来说,即便你完全不懂如何下,也不影响去了解职业围棋的前世今生,其中无数的传奇时刻,选手之间为了荣耀的恩怨情仇。这里就先介绍下世界职业围棋的现状。&/p&&br&&p&当代职业围棋萌芽始于二战前后的日本,国际围棋赛事则起于1988年,30年发展后已经是一项基本成熟的体育运动,这里的成熟是指运动员的培养体系已经渐趋成熟,棋手一般在15岁之前定段成功,进入职业圈,顶级的棋手往往在18岁之前就已经声名鹊起,20岁出头步入巅峰期,到而立之年后就渐渐淡出一线。像柯洁这样18岁就称霸棋坛,不

我要回帖

更多关于 计算机博弈大赛难不难 的文章

 

随机推荐