酷应用

《刺客信条》《生化危机8》上市，AI训出的敌人可以强到什么地步？

百家作者：硅谷洞察 2020-07-29 12:59:28

热点追踪?/ 深度探讨?/ 实地探访 /?商务合作

当地时间7月24日，微软 Xbox Games Showcase 直播发布会如期举办，公布了包括10部全球首度公布作品、22部专为Xbox主机独占打造的作品、Xbox Game Studios工作室成员中9个工作室的作品，以及多部来自合作伙伴的作品。

Xbox games showcase直播中展示了多款游戏，图片来自网络

此次次世代游戏中最让人期待的，非《生化危机8》和《刺客信条：英灵殿》莫属了。经过24年和13年的漫长历程，《生化危机》和《刺客信条》系列已然成为主机游戏世界里程碑式的存在。在两个系列的续作回归宣传中，除了画面升级、剧情更新等续作的常规操作外，两家开发商都特意提到了游戏中AI的升级。

《刺客信条：英灵殿》的创意总监Ashraf Ismail在接受媒体采访时提到：本次作品相比前作最大的不同在于敌人的AI系统得到了很大提升，玩家在游戏中遇到敌人不再是“傻白甜”，而是会利用不同的战斗地形和团队配合来对付玩家，这让玩家在每次面对同一敌人时会有不同的战斗体验。

《刺客信条：英灵殿》，图片来自网络

国外知名游戏博主EVIL VR 在一条爆料消息中表示：《生化危机8》最大的亮点就是敌人AI会有质的飞跃，生化危机系列历代游戏的僵尸和敌人看起来都很“蠢”，而这一代的敌人将会脱胎换骨的进化，每个敌人看起来都会思考，不仅如此，它们还非常具有团队合作精神，会根据不同的情况来制定不同策略从而给玩家制造麻烦。

举个例子：当一个敌人见到玩家后，首先会根据你的弹药量，血量而制定不同的策略，或是求救，或是逃跑，或是围攻，而围攻的时候不再是眼神攻击，敌人会时刻判定你的空隙，一旦玩家有任何一方不注意，就会发动猛烈的攻击，而逃跑的敌人或许不是真的逃跑，而是留有更狠辣的后招埋伏玩家。

《生化危机8》将于2021年上市，图片来自网络

其实，游戏早已成为AI发展的重要载体，从最初IBM的“深蓝”到谷歌的“AlphaGo”再到马斯克投资的OpenAI，都选择了采用“游戏”的方式来展现自己的研究成果。

那么，为何这些大公司都选择用游戏来展现自己的AI研发实力呢？AI会给游戏行业的未来带来怎样的影响和挑战？

AI操纵的“敌人” 早已可团灭人类玩家

最早的游戏AI原型，可以追溯到经典的街机游戏《吃豆人》中里面那四种不同颜色追着玩家满世界跑的怪物。虽然那时的开发者只是赋予了它们不同的追击算法，但那确实是一次非常有意义的尝试。这次尝试为原本规则简单的《吃豆人》带来了不可预知的变化，让每一次的游戏都没有固定的规律可循，让玩家有了持续游玩的动力。

事实上，当时制作《吃豆人》的岩谷彻并不知道“人工智能”和“AI”这两个词汇，更没有提前开发出所谓的AI程序来制作《吃豆人》，整个过程是在不断思考中优化而实现的。对于当时的岩谷彻来说，只需要思考玩家如何从游戏中获得快乐，而这种从玩家角度出发的开发思想就在不经意间让AI这项技术『缠』上了当时世界上最早的一批游戏制作者。

《吃豆人》中的幽灵为后来的游戏AI奠定了基础，图片来自网络

往后开始，游戏开发者们开始不停的在游戏中设计各种各样AI敌人来控制游戏的难度，《超级马里奥》、《塞尔达》、《波斯王子》等游戏都是那个时候经典之作。虽然名叫AI，但那时的AI仍然处于“人工智障”阶段，游戏中敌人的动作都是基于制作者事先设置好的语言脚本完成的，从早期《吃豆人》的策划书中也有聊到。

可以说，AI的应用对于整个游戏行业的意义是非同寻常的。当然，不同类型的游戏中的AI作用也不同。比如，棋牌类游戏中人们可以通过AI对于围棋的学习来改变自己的学习方式，从而来找到更加合理的策略。而对于电子游戏，AI的加入极大地增加了游戏玩法的趣味性和不确定性。”

经典游戏《塞尔达传说：旷野之息》，图片来自网络

而不管是哪种游戏，游戏中的敌人和队友都需要随时随地与玩家保持互动，这是一个极佳的AI研究环境，这也是AI之所以能在游戏中的发展如此迅猛的主要原因。

“自我博弈”：AI完胜的秘诀

其实，游戏AI打败人类玩家甚至是职业选手早已不是什么新鲜的事情。最标志性的事件就是由Google旗下的DeepMind公司研发的AlphaGo先后战胜世界围棋冠军李世石和柯洁。

AlphaGo的横空出世可以说是AI行业里最重要的里程碑之一，它标志着AI的进步已经在某些方面可以与人类一较高下。

而在关注度更高的电竞行业中，AI的表现更是惊艳了所有玩家。相信熟悉Dota2的玩家都应该知道，2017年Ti7国际邀请赛上，一个名叫OPEN AI的超级人工智能2：0『完虐』了Dota2的传奇职业选手Dendi。在比赛中，OPEN AI操作的英雄除了依靠绝对精准的数值计算，还熟练掌握并运用了拉扯兵线、吸引/取消仇恨、越兵线压制、打断打药，甚至骗补刀消耗这些游戏中的技巧。

Dota2传奇职业选手Dendi，图片来自网络

可是，计算精妙的且学习能力超强的AI也不是屡战屡胜。在一年后的Ti8国际邀请赛开幕式上，由OPEN AI进化而来的OpenAI Five在5V5表演赛中输给了一支名叫paiNGame（简称：PG）的参赛队伍。小探特意去回顾了这场比赛，虽然OpenAI Five在比赛中落败，但其击杀数一直都领先于PG战队。

那么，为什么AI能够在游戏中“大显神威”甚至击败人类世界的顶尖选手呢？这就不得不提到在AI的不断进化和学习过程中一个特别重要的环节——自我博弈。

自我博弈是在计算机中，算法可以制造出两个或者多个这样的“我”（机器学习中叫做“智能体Agent”）来相互对抗，通过比较对抗之后的结果来找到更好的策略，是计算机在寻找纳什均衡点的重要手段。

在“自我博弈”中，机器人与自己复制品的实力相当，就可以避免因对手太强或者太弱而学不到东西。而且，由于机器人的决策和操作速度远远超过人类，它就可以在短时间内用海量的比赛来迅速获得更多经验。

当年《自然》杂志以AlphaGo为主题制作的封面，图片来自网络

AlphaGo曾经通过自我对弈3000万盘，来提高自己神经网络的精度。而OpenAI则是完全从零开始，在对Dota游戏世界没有认知的情况下就开始通过自我对练学习游戏方法。

研发团队也表示，他们并没有为OpenAI机器人编入对战策略，没有为它指定任何战术，一开始也没让它与人类高手对练，而是让它“放飞自我”，随机行动，在一次次失败过程中逐渐掌握了游戏打法。

这也是AI在技能施放和团战支援中做的比人类好的重要原因。

但即便是这样，在Dota2的5V5比赛中AI还是输掉了比赛。因为在这类游戏中，获得胜利的一方往往是通过在某一时间点中通过侦查和经验判断做出的复杂决策来取得优势，比如：什么时候进攻，什么时候撤退，从哪进攻，分兵和包抄，偷袭和骚扰，佯攻和引诱等。

这种决策往往在执行时伴随着失败的风险，简单来说就是根据不完全的信息做出“赌”的举动；而作为“完全理智”的AI是永远不会做出这样的决定的，它们往往会选择最为保险的取胜方式，这也是人类之所以能够战胜AI的主要原因。

是AI间的游戏，还是游戏的未来？

随着 Google、Facebook、IBM 等科技巨头在这方面的投入和引导，AI在未来即时战略游戏上打败人类似乎已成定局。

但如果我们只是创造一个将来有可能击败我们的对手岂不是太“自讨没趣“了？当年AlphaGo相继击败了李世石和柯洁之后，围棋选手们并没有因为一个“超级”电脑的出现而对这项历史悠久的游戏失去兴趣，反而是利用人类自己的创造性探索更多的围棋玩法和策略。可以说AI的加入能够带给玩家更好玩的游戏体验。

那么，游戏AI的未来会走向哪里呢？

所有开发者都认为，CPU和3D显卡特性的持续提高将继续给AI开发者带来更多力量，行业会继续慢慢远离单一而刻板的规则模式，转而通过各种方式创造更多有目的性的灵活AI。可以说，可拓展AI将继续得到更多关注和支持，主要体现在第一人称射击游戏领域和更复杂的策略游戏。

有研究小组使用《GTA5》进行自动驾驶的试验场地，图片来自网络

而在游戏之外的领域，游戏AI的作用也非常突出。著名3A大作《GTA5》就为自动驾驶提供了完美的试验场地。英特尔和普林斯顿大学的科学家们利用这款游戏中的开放性和复杂性来来试验自己自动驾驶算法。

但从游戏本身而言，AI的加入同时也面对着一些不小的挑战。

从技术方面来看，算力、数据、训练方式是目前游戏AI需要解决的三大难点

第一，机器学习算法对算力的需求量是非常大的。在网络游戏中的AI运算力还可以依靠外部服务器来进行解决，但如果单机游戏中处处充满AI，那就意味着玩家的CPU需要非常有超强的算力，就如同Alpha Go这种超级人工智能的算法并不是任何电脑都能承受的，算法的训练往往需要专用的AI芯片。

AI芯片往往比普通CPU算力更强，图片来自网络

第二是数据需求，现阶段的AI模型大多是基于『模式匹配』的算法来进行数据建模的，这就需要AI在海量的数据中去寻找出某一条规律。假设没有庞大的数据来进行支撑，那么AI就无法得到有效的训练，从而在对抗中甚至出现错误的判断。

例如围棋，AI可能在几十秒中能推演上万个来回。正是因为围棋这样的游戏有着既定的规则，AI才能顺着规则路线快速生成海量的数据并进行建模，这也是为什么棋牌类游戏能率先被AI攻占下来的原因。

第三是训练方式，机器学习的训练分为两种，一种是上述我们聊到的『自我博弈』。另一种是通过实际人类对战的数据来进行训练，告诉机器“人是怎么做的”“怎么做能获胜”。

从目前游戏AI的发展成果上看，在围棋、打砖块、推箱子等规则相对简单的游戏中，自我博弈的训练方式似乎获得了更好的效果，因为这些游戏都无需依赖其他外部输入，实现高效的模拟对战。

打砖块等规则简单的游戏训练起来相对容易，图片来自网络

但随着游戏复杂度的提升，模拟对战变得越来越低效，对于动辄需要上千万次对战的AI来说，如此低效的训练方式是无法接受的。

而另一种通过与人类对战进行模仿训练的方式则受限于数据的准确性和完备性，是否覆盖到可能出现的所有战术、情况就显得尤为重要，一旦数据缺失就可能造成训练出的AI出现“偏科”的情况，并且人类做出的举动也并不是一定正确。

而从整个游戏行业的角度来说，想要实现未来AI大面积介入，同样也存在着不小的挑战。

首当其冲的就是游戏寿命的问题，要想真正的训练出一款具有一定智慧行为的游戏内置AI需要大量的数据对其进行训练，然而这种训练是需要长时间积累的。但是，一款游戏的寿命是有限的，等到AI经过几年时间的完成训练，也许这款游戏的早就被后来画面更好玩法更新奇的游戏取代。

当然，在画面优化上，AI适用于大部分的游戏。但玩法改革并不适用于所有游戏。就像《Game Marker’s Toolkit》系列作者马克·布朗（Mark Brown）说的“AI必须要适应目标游戏想要的体验。”所以AI在玩法上的优化应该针对特定游戏做出不同的更改，甚至选择不使用。

《魔兽世界》超长的游戏寿命可以称之为奇迹，图片来自网络

所以，对于一家游戏开发者来说，想要长时间吸引大量的玩家并为AI提供训练数据几乎是一件『稳赔不赚』的事情，这也是为什么大多数游戏厂商更愿意将游戏中的AI按照固定剧本写死的原因，因为这样既可以让AI在可控的范围内取悦玩家，还能在短时间内收割玩家的钱包。

而回到大家最关心的那个问题『AI是否会在游戏中全面战胜人类？』

小探认为大可不必担心，因为AI如果想要全面战胜人类的话，除了需要长时间的基础硬件发展作支撑，也需要上述小探提到的”赌“的决策行为，而这种近乎于人类的思考模式，是AI开发者绝对不允许的。

总的来说，AI之于游戏的意义是十分重大的。

对玩家而言，游戏在玩法和开发上的拓展，能带来众多更有趣更精良的游戏；也会让玩家体验变得更特别、更个性化、更令人回味。而对于整个产业来说，更多的创新和技术进步将推动产业的蓬勃发展，更加良性。

随着时间的推移，AI与游戏的融合也在一步步加深，虽然还存在着不小的挑战，但正因为有这种不确定性的存在，游戏才能成为游戏，玩家们才能为止着迷与期待。

（文本特别鸣谢硅谷资深AI工程师波尔的指导与贡献）

参考资料：

https://www.gcores.com/next

https://www.gcores.com/articles/125040

https://baijiahao.baidu.com/s?id=1665725807897691248&wfr=spider&for=pc

https://zh.wikipedia.org/zh/%E5%88%BA%E5%AE%A2%E6%95%99%E6%A2%9D%E7%B3%BB%E5%88%97

https://www.youtube.com/watch?v=NIOU6Vjt478

https://residentevil.fandom.com/wiki/Ambient_AI

https://esportbet.com/openai-five-wins-a-total-of-4369-games-against-humans-in-84-hours/

https://openai.com/blog/openai-five/