DeepMind道场将训练AI击败人类星际争霸球员

 作者:池弋颟     |      日期:2017-06-02 04:41:08
Oliver Berg / dpa / Alamy现场新闻Timothy Revell星际争霸球员是安全的 - 但不会很久制作简短国际象棋的机器,Scrabble和Go开始着眼于古老的视频游戏虽然大多数视频游戏的固有复杂性使得它们成为人工智能比棋盘游戏更难的目标,但两个新项目旨在表明它们远非无懈可击其中一个是针对星际争霸的人工智能训练场,今天由游戏创作者暴雪娱乐公司与谷歌的AI公司DeepMind合作开放另一个是由丹麦研究人员开发的人工智能,他的方法是在游戏中击败人类的第一个好机会但这不仅仅是视频游戏的霸主地位:击败星际争霸可以推动整个人工智能领域的发展作为训练场的一部分,DeepMind和Blizzard发布了一套工具,旨在让研究人员更容易开发AI玩家他们还承诺发布数十万个视频,展示真实的游戏供他们训练在DeepMind成功破解Go之后,新的尝试变得热烈今年早些时候,该公司的专家AI,AlphaGo,以3比0击败了世界排名第一的球员科杰,首次展示了一个超人对游戏掌握的人工智能为了实现这一目标,AlphaGo从数百万人的行动中分析和学习,并与自己进行了数千场比赛但星际争霸是一个更难实现的目标在游戏中对人类进行人工智能训练并且它崩溃了即使是业余爱好者也可以击败最好的人造球员马耳他大学的Georgios Yannakakis表示:“如果有一种方法可以记录人类星际争霸的最佳处理程度,那将是惊人的” “星际争霸”涉及建立军队和基础设施,以便在大型虚拟地形上与对手作战人工智能游戏如此困难的主要原因是比赛可以发挥的大量可能方式据估计,每场比赛有101685种可能的配置相比之下,Go有大约10170.你可以计算宇宙中的每一个质子,加上自大爆炸以来已经过去的每一秒,你仍然不会接近可能的星际争霸位置更重要的是,与棋盘游戏不同的是,玩家可以同时并实时地进行游戏玩家通常无法准确看到他们的对手在做什么,因此必须根据不完整的信息做出决定所有这些意味着你不能只是使用蛮力来找到玩游戏的最佳方式因此,玩家不需要确定最佳动作是什么,而是需要策略来指导他们 - 以及直觉现在丹麦哥本哈根IT大学的Sebastian Risi和他的同事Niels Justesen已经开始将AlphaGo方法应用于星际争霸到目前为止,他们已经从超过2000场比赛中提取了大约630,000个动作,这些动作涉及一些最好的人类星际争霸球员这使得它能够慢慢地学会预测一个成功的人在游戏的特定状态下会做什么,这样当面对类似的选择时它可以做类似的事情目前,Risi和Justesen的方法甚至可以被其他一些星际争霸玩家的AI击败然而,这些人类策略都被硬编码到其中,这意味着一旦人类对手在他们的策略中发现了一个漏洞,他们就会从那时起轻易击败他们 - 人工智能无法适应 Risi和Justesen的AI是第一个使用深度神经网络,一种模仿大脑神经元的计算机技术,从人类星际争霸游戏中学习这意味着他们的人工智能将为自己学习策略,他们希望最终能够超越竞争对手 - 而且很可能,因为同样的方法导致AlphaGo占据主导地位在接下来的几个月里,它将开始玩自己的游戏以进一步磨练其技能 - 可能在DeepMind道场内 “我们迫不及待想要尝试,”里斯说他们的工作将在本月底的计算智能游戏会议上公布 DeepMind并不是唯一一家试图训练星际争霸玩AI的公司 - 昨天,Facebook发布了自己的数据集除了视频游戏的荣誉之外,还有更多这一切 “星际争霸比现实世界更接近现实世界,”里斯说这意味着破解星际争霸甚至可以加速人工智能的总体进展,因为掌握游戏需要内存,策略和规划的复杂组合 “游戏的丰富性意味着它是通往现实世界的有用桥梁,”DeepMind的Oriol Vinyals说更多关于这些主题: