大数据文摘作品,转载要求见文末
作者:宁云州、魏子敏、Aileen
星际II的玩家们,你们准备好迎接被AI支配的恐惧了吗?!
早在去年,Deepmind已经立下Flag要教会AI玩儿星际争霸II,也已经有包括facebook、阿里巴巴等不少科技公司或者研究机构开拓过“星际”这片竞技场,但DeepMind这样专治人类各种不服的公司正式宣布与暴雪合作,还是让一票星际玩家大呼“热血”。 暴雪承诺将持续发布从“星际争霸II”天梯中收集的数十万个匿名录像,这会将训练变得更加容易。 当然,这也不是一项轻松的任务:视频游戏的复杂性和更多可能性也让AI战胜人类要远比在棋盘游戏上复杂。
但是不可否认,不管对于星际玩家圈还是AI圈来说,这都是一件大事情,因为星际争霸远比像围棋这样的游戏更接近现实世界。
搞定星际争霸可能需要十只升级版阿尔法狗
星际争霸和星际争霸II是史上最大和最成功的游戏之一,它们见证了许多玩家从青葱岁月到为人父母的20多年。其原始游戏早已被AI和ML研究人员使用,并在每年的AIIDE机器人大赛中进行角逐(http://www.cs.mun.ca/~dchurchill/starcraftaicomp/)。
昨日凌晨,DeepMind宣布与暴雪娱乐合作,发布了SC2LE,一个旨在加速即时战略游戏当中AI应用的工具集,SC2LE包括:
暴雪开发的一种可以让研究人员和开发人员投入到游戏中的机器学习API,这包括第一次为Linux发布的工具。
一个匿名的比赛录像数据集,这将使得比赛录像的数据集从原来的65,000增加到超过50万。
一个开放源码的版本的DeepMind的工具,PySC2,让研究人员能够方便地使用暴雪的特征层API和他们的代理。
一系列简单的RL小游戏,允许研究人员测试代理在特定任务上的表现。
联合文件,用以概述环境,报告迷你游戏的基本结果,根据游戏回放监督学习,和使用AI与人类进行完整的1v1对战。
使用AI在星际争霸中对战人类玩家会比围棋艰难得多,对于AI来说,最大的难点在于,每一场对决都存在大量可能的方式。
据估计,每场对决有101685种可能的配置,为了给大家一个直观感受,阿尔法狗的配置层是10170。
DeepMind为什么在围棋之后选择星际争霸
星际争霸拥有丰富多彩的游戏环境和战术体系,这是AI研究的理想环境。
行动是否对人类和代理都可用取决于选择的单位。
PySC2环境提供了一个灵活的,易于使用的RL代理游戏界面。在最初的版本中,游戏被分解为‘特征层’,其中的游戏元素,如单元类型、单位的健康度和地图的可见性彼此隔离,同时保留游戏的核心视觉和空间元素。
这次发布的PySC2还包括一系列的迷你游戏,一种将游戏分解成小模块的技术,可以用来测试特定任务的代理,比如移动视角、收集矿物碎片或选择单位。DeepMind希望研究人员可以测试他们的技术,并且开发新的迷你游戏,以供其他研究人员进行使用和评估。
简单的RL迷你游戏可以让研究者测试代理在一些特定任务上的表现
训练过和未训练过的代理在玩迷你游戏
从十万匿名录像中向顶级人类玩家吸取经验
现在,丹麦哥本哈根IT大学的Sebastian Risi和他的同事Niels Justesen已经开始将AlphaGo应用于“星际争霸”。 到目前为止,他们已经从有世界上最好的人类星际争霸玩家参与的超过2000场比赛中提取了大约630000场录像,训练了他们的AI,让它慢慢地学会预测一个顶级的人类玩家在某些特定的游戏状态下会做什么,这样当面对类似的选择时,它可以做出顶级玩家会做的判断。
目前,Risi和Justesen的成果仍可以被其他“星际争霸”的机器玩家打败。 然而,那些机器的方法是把人类战略硬编码进系统,这意味着一旦有人类对手在战略中发现了一个漏洞,他们就能够从那里轻松地击败他们,这样的机器是不具备和人类正面对决的能力的。
这意味着,破解“星际争霸”甚至可以使AI通用地进步,因为玩好这款游戏需要考虑存储,策略和操作并且规划这一系列复杂的组合。 DeepMind的Oriol Vinyals说:“这款游戏是一座通往现实世界的桥梁。”
在星际争霸2的世界顶级赛事中,人类玩家在比赛中奇诡的战术和精湛的操作,往往使我们感叹于玩家技术水平的高超,而如果AI能够像在围棋比赛中击败柯洁那样在星际争霸2这类对操作、策略和运营的要求都达到极限的游戏中击败人类的顶尖选手,我们还有兴趣打开电脑在鼠标高频率的敲击声中日复一日地攀爬天梯吗?
相信即便面对来势凶猛的末日人机,还是会有无数的玩家像泽叔一样喊出那声“为了艾尔而战!”
举报/反馈

大数据文摘

21.6万获赞 10.4万粉丝
专注数据,分享价值。
关注
0
收藏
分享