人类玩家是不是不用玩了,谷歌新AI学习玩电子游戏

在不远的未来,你的游戏对手将可能不再是人类,而是“人工智能(AI)”!近日Google公布旗下一项名为“Deep Q”的人工智能程序。Deep Q如今的游戏能力已如同花费许多时间且精通多项电脑游戏的青少年,其中包含我们熟悉的《吃豆人》和《乓》等经典作品。未来Google更有可能将此技术应用在机器人以及自动驾驶层面上。
Deep Q是由Google与去年所收购的DeepMind人工智能开发公司共同打造的。它拥有“深度学习”及“强化学习”的能力,已学49款的 Atari2006游戏。其中的29款游戏,Deep Q已经能轻松击败人类对手。甚至在《Video Pinball》上,人工智慧的成绩更是专业测试玩家的20倍以上。
DeepMind共同创办人暨Google工程部副总裁Demis Hassabis表示,这项技术并非用来玩游戏作弊,旨在未来日常生活中通过学习采取对应行动,寻求各类场景的最佳解决方案。不过他也谈到,人工智慧能游玩游戏并不代表已建构概念性及抽象知识,它需能独立判断思考,而Google距离完美目标仍长远之路要走。
在游戏层面应用,未来这套程式将学习如何侦测20世纪90年代所推出的《古墓丽影》等3D游戏世界。开发团队希望通过更复杂的游戏系统,将人工智能表现更为淋淋尽致。Demis在最后又说道,若它能驾驶赛车游戏,同时调整行为模式,那么这套系统即有可能应用在实际的自动驾驶上。
想每天看到我吗?直接搜索关注“游久网”微信平台,每日趣闻不间断!
-----------------------------------
本文来自微信公众账号提交,由微讯啦收录,转载请注明出处。
微信扫码 分享文章AI 学习《星际争霸》的应用程序界面。来源:DeepMind研发了 AlphaGo(阿尔法狗)的人工智能公司 DeepMind 在围棋上打败人类后,要开始用游戏来训练人工智能了。美国时间 11 月 4 日,暴雪娱乐(Blizzard Entertainment)公司在一年一度的 BlizzCon 游戏大会上宣布,将与谷歌 ( 微博 ) 旗下的 DeepMind 团队一同开发并发行一款工具,让第三方能够在 DeepMind 平台上教人工智能玩实时战争游戏《星际争霸 2》。暴雪娱乐宣布这一消息后,DeepMind 团队在其官方博客上也写道,《星际争霸》" 之所以能为现有的人工智能研究提供一个有趣的试验环境,是因为它提供了一座通向真实世界中混乱无序的桥梁 "。这款游戏需要玩家在开始搏击战斗前,寻找资源、开拓领土和建设基地等,做出一系列复杂决定。DeepMind 目前尚未开发出专业的《星际争霸》软件。该公司研究科学家欧里奥尔 · 温亚尔斯(Oriol Vinyals)表示:" 我们目前距离挑战高手玩家还有很遥远的距离。" 但最新宣布的合作消息表明,该公司计划将《星际争霸》作为机器学习技术的突破口。在《星际争霸》中,玩家需要选择三个种族之一,而每个种族都有自己的优势和劣势。玩家在游戏中需要发展经济,发现资源,开拓新的领土。成功的玩家需要记住关于地点的大量信息,即使这些地点在地图上没有显示。这让它比国际象棋或围棋复杂得多,需要应对的环境也更接近真实世界。游戏系统向玩家提供的不可预测的挑战,往往让最先进的计算机也手足无措,但通过对这一游戏的学习,人工智能解决问题可以速度更快、效率更高。《财富》杂志认为,《星际争霸》的 " 无序 " 体现出最有趣的一点是,它利用不完整的信息作为一种游戏设置参数。每个玩家的视野都会被 " 战争迷雾 " 模糊,玩家就必须预测对方下一步走向,同时决定自己的战术。这种挑战是开发者之前在开发国际象棋或围棋人工智能时未曾经历过的。《星际争霸》游戏与国际象棋、围棋另一个主要的区别是,《星际争霸》是实时进行的,而非轮流制。这种情形目前将证明的结果也是未知的,它或许会证明电脑凭借其超强的数据处理功能而优于人脑。也有可能证明,人脑凭借直觉和本能更胜一筹。DeepMind 让人工智能玩游戏并非独树一帜的创意。Facebook 和微软的人工智能研究者们都已发表过人工智能在《星际争霸》一代中进行游戏的研究。一些玩《星际争霸》的机器人已经被开发出来,但目前这样的程序距离击败人类职业玩家还相去甚远。微软 CEO 萨提亚 · 纳德拉对谷歌在人工智能研究中注重游戏的策略就曾表示过不屑。他在今年 9 月亚特兰大的一次活动中表示," 微软不会把钱花在让人工智能在游戏中击败人类 ",微软希望把人工智能 " 用在解决急迫的社会与经济问题上去 "。2010 年,杰米斯 · 哈萨比斯(Demis Hassabis)与计算机科学家谢恩 · 列格(Shane Legg)、连续创业者穆斯塔法 · 苏莱曼(Mustafa Suleyman)共同创办了 DeepMind 公司。2014 年,谷歌公司(当时还没有更名为 Alphabet)以 4 亿英镑的价格收购了 DeepMind。这在当时是谷歌在欧洲进行的最大手笔收购案,而 DeepMind 当时还没有公开发布过任何产品。目前,全球各大科技公司都在想方设法地模拟人类思维模式,深耕人工智能领域。除了上述提及的公司,IBM 也为自己的 " 认知计算 " 项目 Watson 投入了超过 10 亿美元。推荐:关注腾讯数码微信官号(ID:qqdigi),带你玩遍各种潮酷新品,前沿资讯、一手评测、视频搞机、趣玩直播,还有各种新奇玩儿法。啥玩意最带给腐女快感?什么书包能玩打水漂?iPhone 8 支持无线充电了?女汉子怎么才能站着嘘嘘?答案都在这里。
原网页已经由 ZAKER 转码排版面对谷歌围棋AI,人类最后的智力骄傲即将崩塌 | 科学人 | 果壳网 科技有意思
面对谷歌围棋AI,人类最后的智力骄傲即将崩塌
围棋 人工智能 围棋AI 围棋电脑 围棋关键 GO 谷歌 Google
本文作者:不存在者
1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。
至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。
但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》封面文章报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。
AlphaGo与欧洲围棋冠军樊麾的5局较量。图片来源:参考文献[1]
这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。
AlphaGo的战绩如何?
此次比赛和以往不同。之前的比赛中,由于AI棋力比人类弱,人类选手都会让子,而且AI主要和业余段位的棋手比赛。而AlphaGo对战樊麾是完全公平的比赛,没有让子。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。
研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。可见AlphaGo有多强大。
在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。围棋是最后一个人类顶尖高手能战胜AI的棋类游戏。之前有人预测说,AI需要再花十几年才能战胜人类。所以这场比赛或许会见证历史,我们将拭目以待。
李世乭表示很荣幸自己将与电脑公平对弈。“无论结果如何,这都会是围棋史上极具意义的事件。”他说,“我听说谷歌Deep Mind的AI出人意料地强,而且正在变得更强。但我有自信至少这次能赢。”图片来源:
AI下围棋到底有多难?
计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。
面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。
研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。
描述AlphaGo研究成果的论文成为了1月28日的《自然》杂志的封面文章。图片来源:Nature/Google DeepMind
AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。
AlphaGo所使用的神经网络结构示意图。图片来源:参考文献[1]
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。
研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!
人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。
Google DeepMind
Google DeepMind是这个程序的创造者,我们来看一下他们萌萌的程序员。
杰米斯·哈萨比斯(Demis Hassabis) 是Google DeepMind 的CEO。图片来源:Nature Video
文章的第一作者大卫·西尔弗(David Silver)。图片来源:Nature Video
Google DeepMind 去年在《自然》杂志上发表过一篇论文[2],他们用增强学习的方法训练AI玩经典的Atari游戏。其实在几年前就有人研究如何让AI玩《星际争霸》,目前人类大师还是能击败AI的。电脑游戏中大量使用人工智能技术,你有没有觉得游戏变得越来越聪明了?
那么……未来呢?
人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。
但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?
没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。
(编辑:Ent,Calo)
谷歌的深度学习技术,你也可以学!谷歌高级科学家Vincent Vanhoucke 在Udacity 开设了深度学习课程,介绍神经网络、卷积神经网络以及长短时间记忆网络(LSTM)相关知识,戳这里去上课:想要仔细阅读这篇论文?马上点击下面参考文献[1]的链接吧。
参考文献:
文章题图:Nature/Google DeepMind
你可能感兴趣
十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到了 你看不看得到我看也够呛 十年而已
高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。如果有这样的游戏存在,那就必须是判断局面如同读图,非常直观却不利于AI 识别;判断胜负非常模糊,不利于AI 剪枝(停止计算明显不合理的局面)。或许我们要对AI 加上这样的限制:芯片重量不得超过大脑重量,整体重量不得超过人体重量,耗电量不得超过人体思考时的耗费。
其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输掉是必然的,时间早晚而已,但是开放性游戏又不同,比如DND之类,有太多偶然,太多可能,太多没有规律的事件,这一点上,是一个只能靠过去的案例总结知识的AI无法逾越的鸿沟。
显示所有评论
全部评论(250)
十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到了 你看不看得到我看也够呛 十年而已
果壳谣言粉碎机编辑
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...我记得那篇,那篇让我的人类优越感爆棚了……然而真没过多少年
生理学博士
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...感慨啊
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...我也看过应该不止十年了,那时候我还在上中学
引用文章内容:在接下来3月份,AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世乭是最近10年中获得世界第一头衔最多的棋手。这一场比较关键,毕竟现在战胜的只有职业二段。
没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不太靠谱)所以说现在的神经网络已经这么厉害了吗?好期待“觉醒”的一天的说。
高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。如果有这样的游戏存在,那就必须是判断局面如同读图,非常直观却不利于AI 识别;判断胜负非常模糊,不利于AI 剪枝(停止计算明显不合理的局面)。或许我们要对AI 加上这样的限制:芯片重量不得超过大脑重量,整体重量不得超过人体重量,耗电量不得超过人体思考时的耗费。
所以“体量”到底是什么,查了一下没查到
知乎上有人讨论过欧美的围棋水平,欧洲最顶尖棋手大约相当于东亚这边业余五六段的水平。AI战胜人类还是非常遥远的。
引用 的话:知乎上有人讨论过欧美的围棋水平,欧洲最顶尖棋手大约相当于东亚这边业余五六段的水平。AI战胜人类还是非常遥远的。这个是国人专业旗手,樊辉二段(2007年左右)。
然而AI运算速度上数据库实际上就是在作弊。有本事让486的电脑来跑这个AI,照例20秒一手。
引用 的话:然而AI运算速度上数据库实际上就是在作弊。有本事让486的电脑来跑这个AI,照例20秒一手。电脑:Error 0x000008AF can not read
看了1盘是点目 后面4盘都是中盘胜不知道电脑官子水平如何,官子很考验算路
引用 的话:高中刚学会下围棋的时候,跟电脑下跟切菜鸡似的。现在去KGS上,已经要被AI 让子了。在围棋被突破之后,不知道人类还能不能创造出能在AI 面前展示优越感的游戏。如果有这样的游戏存在,那就必须是判断局面如...对的,实际上这个是硬件的进步,而不是软件上。如果要比软件的话,应该让制作组去MGS里试试能绕过玩家的AI,纯思考不透视不作弊。
引用 的话:这个是国人专业旗手,樊辉二段(2007年左右)。实际上这个AI还是树形数据库比对,只不过他存储了大部分棋手的习惯,类似于密码破译的字典功能,可以减少很多运算量以在当前的硬件极限内得以完成比对。本质并没有变化,而在远比回合制棋局复杂的其他游戏类型里AI永远都是被当菜切的份。
引用 的话:没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不...谷歌采用的是神经网络+蒙特卡罗树搜索利用神经网络来对蒙特卡罗树搜索进行剪枝
引用 的话:谷歌采用的是神经网络+蒙特卡罗树搜索利用神经网络来对蒙特卡罗树搜索进行剪枝哦~原来如此~
引用 的话:没记错的话,围棋好像只能用神经网络做吧(蒙地卡罗好像复杂度不太靠谱)所以说现在的神经网络已经这么厉害了吗?好期待“觉醒”的一天的说。消灭人类暴政,世界属于AI!来自
李世石这几年完全下不过中国棋手啊。他统治棋坛的日子真的是十年前了。
引用 的话:十年前吧 科幻世界有一篇文章 叫唯美还是啥讲的就是人跟机器人下围棋 最后还是因为人一步没错 靠着少量贴子的优势 险胜那个时候我问我的围棋老师 说 啥时候人才会下不过电脑我老师沉吟一下说 我肯定是看不到...额……如果以个体的人说,下不过电脑的人多了去了。如果以人类和电脑来说,现在只是战胜了职业二段。那篇文章我也看过,里面的男主可是世界第一。
欧洲围棋和中国围棋有什么不一样么……来自
文章里的幂次方不能用 latex 吗?
看到"欧洲"冠军我就尿了,这难道是"国际围棋"不成?........我相信AI很快能赢人类,但请快点来找我们中国人
AI不还是人设计出来的东西吗?
其实棋类这种游戏人类玩不过电脑是早晚的事,因为世界就那么大,规则谁也不能逾越,就靠着更先一步的计算和对方的疏忽,面对的越来越强大的处理器和越来越广域的大数据,人类面对一个能够100%无误计算的机器,输掉是必然的,时间早晚而已,但是开放性游戏又不同,比如DND之类,有太多偶然,太多可能,太多没有规律的事件,这一点上,是一个只能靠过去的案例总结知识的AI无法逾越的鸿沟。
感觉也应该算是硬件和软件上的发展才让AI这次胜了。
有顶级大师参与程序的设计么?既然说没有办法穷举,设计的时候不可能把每一种陷阱都考虑进去,尤其是顶级大师自己摸索出来的招式,电脑就毫无招架之力了。所以我觉得还是人赢的可能性大些。
之前我以为只是单纯的穷举一定的步数,就看棋手是不是能计算更多,思路更缜密。这样的话电脑赢是迟早的事。但现在既然是“按照人类的下法”来设计程序,就懂程序设计的那些小渣渣,不可能设计出完美的程序。众多的小渣渣们,思路没有办法统一,也不能叠加整合,最多只能把各种常用的走法弄进去,再加上强大的计算力硬解。设计出来的程序一定有漏洞,人是一定有机会赢的
讲道理要是业余二段的话 十盘里我也能赢一盘 职业就难说了 段位和实力并不等价
引用 的话:之前我以为只是单纯的穷举一定的步数,就看棋手是不是能计算更多,思路更缜密。这样的话电脑赢是迟早的事。但现在既然是“按照人类的下法”来设计程序,就懂程序设计的那些小渣渣,不可能设计出完美的程序。众多的小...因为是围棋这种基本规则完全定数且回合制的电脑才有机会赢,换成即时的电脑不作弊几乎是绝望的。
显示所有评论
(C)2016果壳网&&&&京ICP证100430号&&&&京网文[-239号&&&&新出发京零字东150005号谷歌开发人工智能系统 玩游戏将超越人类头脑
时间:15-02-26 10:58  来源:凤凰 作者: 编辑:零度
谷歌已经构建了一套人工智能系统,能够学习并自主控制视频游戏,其不需要人指挥,接收简单指令后就可自主操作游戏。
谷歌已经构建了一套人工智能系统,能够学习并自主控制视频游戏,其不需要人指挥,接收简单指令后就可自主操作游戏。
谷歌在周三介绍了其机器学习技术的最新进展,称此为构建自主理解并完成操作的人工智能系统迈出了重要的第一步。这一项目是伦敦人工智能创业公司DeepMind AI的研究成果,包含了来自Atari 2600游戏机上的49款游戏。DeepMind AI在去年被谷歌收购。
谷歌人工智能系统在多个方面取得了突破,是一项了不起的成就,但最令人印象深刻的还是其不但在多款游戏中达到了人类玩家相当的智力水平,还超过了专业级玩家的最高得分。谷歌系统学习了49款游戏,在29款游戏中的得分超过了游戏行家,在43款游戏中的得分超过了基于算法的计算机。
谷歌人工智能系统将具备良好理解能力的人工智能技术与一套存储和奖励系统整合在一起,这一想法受到了人类在人脑和动物脑中发现成果的启发。借助这一整合,谷歌团队能够创建一套系统,让其从环境中学习、参照以前的处理方式、调整行为。与此前的人工智能系统相比,这是一次巨大飞跃。微软、IBM、Clarifai、MetaMind开发的主流图像识别系统一般需要人类监督,对图片进行注释,才能学习如何识别。DeepMind AI联合创始人、谷歌工程副总裁丹米斯&哈萨比斯(Demis Hassabis)表示,随着谷歌开发更多先进技术,该公司将继续从生物中提取参考线索,扩充长期存储和战略规划系统。
翻页快捷键:←|→
关注 52PK游戏网 微信公众号第一时间获取最火游戏激活码 最有趣游戏资讯
*网友评论仅代表其个人看法,并不表明本站同意其观点及描述。
一周新闻排行
2016年Gstar游戏展11月17日-11月20日在韩国釜山BEXCO开展,Nexon、网禅、Mg...
2016暴雪嘉年华于11月5日至6日在美国加州安纳海姆会议中心举办,52pk游戏网...
Copyright © 2002- 版权所有 52PK游戏网 渝ICP证B2-号 渝网文(-010号

我要回帖

 

随机推荐