神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

百家 作者:机器之心 2020-08-02 13:51:49
机器之心报道

编辑:魔王

在游戏里训练「神经网络小怪兽」,学习强化学习!


想了解神经网络,但不知道如何入手?教程太枯燥,论文不好懂?

别怕,这里有款多人在线战术竞技游戏(MOBA),让你在西部牛仔的世界中训练自己的神经网络。在这里,所有「智能体」都是类似怪兽的生物,还有武器!

故事的背景是:Derk 博士想要创建一个具备「神经网络」大脑的生物。

这款名为「Dr. Derk's Mutant Battlegrounds」的游戏是一个基于 AI 的实验性游戏。玩家的任务是武装自己的小怪兽(Derkling)并训练,与其他玩家进行 battle。

而这些小怪兽其实是货真价实的 AI:循环神经网络(RNN)。它具备 30 个输入、12 个输出、32 个记忆插槽(memory slot)、1 个隐藏层和 3000 多个参数,能够「看到」30 多项事物,还能自主决策。


 哇,神经网络这么 cute 吗!是不是很想赋予它超能力?

闯关和 battle 胜利,你就可以升级小怪兽的能力和装备!而这对玩家的挑战在于:选择最好的装备和训练策略。

在这个游戏环境中,有大量策略可供探索,玩家可以教小怪兽进行大量尝试。比如教它们如何治疗上单,穿过敌人的队伍直达敌军老巢(雕像),或者戏耍对手…… 玩家可以在这里尽情尝试和探索不同的策略。

经过多次迭代,小怪兽终于直达敌军老巢,干掉了敌方的雕像。

小怪兽升级装备了,有枪!

这次不再是与游戏内置的 boss 对战,而是玩家团战。看起来战况很激烈!

Derk 博士使用了哪些技术,帮助小怪兽成长

就整体技术而言,这款游戏使用的技术类似于 OpenAI Five。OpenAI Five 两年前打败了 Dota 2 人类玩家,不过这款游戏中的小怪兽的脑袋远不如「OpenAI Five」那么强悍。

此外,这款游戏的技术细节还包括:

  • 小怪兽通过 GA 在并行运行的 128 个「竞技场」(arenas)上进行训练;

  • 所有的模拟和神经网络均在 GPU 上运行,方便快速获取结果(在一台性能不错的计算机上 1 分钟内即可训练 200 代);

  • 智能体可以和游戏内置机器人 PK,也可以互相 battle(自对弈),或者将这两者结合起来;

  • 对于想要深度挖掘小怪兽的「大脑」,充分理解其行为的人而言,这款游戏提供了不错的可视化效果。


目前,这款游戏已发布到 Steam。

参考链接:

https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/
https://www.youtube.com/watch?time_continue=27&v=-Lqb8cce5tk&feature=emb_logo
https://derkgame.com


机器之心联合旷视科技开设线上公开课:零基础入门旷视天元MegEngine,通过6次课程帮助开发者入门深度学习开发。


8月4日,旷视研究院深度学习框架研究员刘清一将带来等二课,主要介绍数据预处理、模型搭建与调参等相关概念。欢迎大家入群学习。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接