有人从英伟达借了台DGX A100,让神经网络自己造了个GTA5自己玩

百家 作者:机器之心 2021-06-27 14:43:20
机器之心报道
机器之心编辑部

人类玩家游戏还没玩通,AI 已经能造个游戏了。


侠盗猎车手 5(GTA5)是一款经典的动作冒险游戏,深受玩家欢迎,多个研究团队曾为它推出补丁,以使其具有更加逼真的游戏质感。

在第三方不断为 GTA5 推出补丁的同时,许多玩家高呼:「GTA6 什么时候能出啊」。我们无法揣摩 R 星的思路,GTA6 目前尚未发布,不过有一款 AI 独立开发的「GTA5」,你可以试试。

它的名字叫做「GAN Theft Auto」,和真正的 Grand Theft Auto 略有差别。


玩家们在玩 GTA5 的时候,干得最多的事情就是在大地图上开车兜风,先来看下效果:


虽然...... 画质是糊了一些,但好在还是能玩的!

这个由 AI 自己开发的「GAN Theft Auto」是开发者使用 GameGAN 制作的。GameGAN 不同于以往用 AI 做游戏的例子,之前 DeepMind、OpenAI 等是在现有游戏框架中创造被用来「玩游戏」的对象,相当于是智能生成一个游戏对手。而 GameGAN 则被用来「创作」游戏,是对现有游戏代码的取代。它在训练过程中摄入大量游戏剧本和键盘动作,通过观察场景和玩家的操作动作,预测下一帧游戏画面,而不访问底层游戏逻辑或引擎。

Kinsley 表示:「游戏中每个像素都是在我玩的时候由神经网络生成的。神经网络就是整个游戏,其中不包含我们或 [RAGE] 引擎编写的规则。」

当然,训练 GAN 是一项非常消耗 GPU 的任务,英伟达借了 Kinsley 一台 DGX A100。DGX A100 售价 19.9 万美元,有 8 块基于安培架构的 A100 GPU,此外还有两颗 64 核 AMD 服务器 CPU。

有了这些算力做基础以后,Kinsley 和 Kukieła 同时运行 12 个 AI 模型。训练的数据集包括三部分:GTA V、Vroom、Cartpole。

他们创建了一个 GTA5 模组,通过一个 Python 脚本来收集数据。游戏模组接受来自 Python 脚本的转向命令、限制速度和其他选项设置,比如天气、交通等。Python 脚本分析出当前汽车位置和最近的道路节点,通过不同的路径尽可能覆盖所有可能的动作和汽车位置。

数据收集过程演示。

此外,他们基于 OpenmAI Gym 的 Box2D CarRacing 环境创建了全景视图数据集 Vroom。汽车被「指示」沿着道路行驶,还包括道路、转弯和 U 形道路的偏移变化以涵盖所有可能的情况:


两人还开发了一个超采样 AI 来清理神经网络的输出结果,让它看起来不那么像素风格。

正如视频中展示的那样,当汽车移动时,它下面的阴影和太阳在后挡风玻璃上的反射也会随之移动,远处的山也越来越近了。

美中不足的地方还有一些,神经网络无法完美复制 GTA5 的每个方面,还有一次 Kinsley 看到迎面而来的警车正要撞上他的车,随后这辆警车一分为二,画面有些离谱。

Kinsley 表示,这项工作仍在不断优化中,除了原始项目之外,他们还提供了一系列改进和修复:

  • 能够使用最新的 PyTorch 版本,目前是 1.8.1;

  • 使用非方形矩阵图像(示例中是 16:8);

  • 更大的生成器和鉴别器模型;

  • 能够使用 2 个以上的生成器;

  • 推理脚本(在 GameGAN 存储库中不存在);

  • 能够在推理中使用上采样模型;

  • 训练期间实时显示生成器输出。


就目前的效果来看,像素风问题已经大为改善了:


如果你也有实力试一试,可以参考这个项目地址:https://github.com/sentdex/GANTheftAuto/

关于 GameGAN

GameGAN 是一个利用生成对抗网络(Generative Adversarial Network,GAN)模仿计算机游戏引擎的神经网络模型,它由一个生成器和一个鉴别器组成,生成器尝试输入数据,而鉴别器将其与原版游戏数据源进行比较。如果它们不匹配,则生成的数据将被拒绝,之后生成器将调整其工作并重新提交新数据。这两个神经网络会相互竞争,并学习建立出全新内容。


GameGAN 论文地址:https://arxiv.org/pdf/2005.12126.pdf

去年,GameGAN 吸引了人们的广泛关注,其在对游戏规则一无所知的前提下,在观看了总计几百万帧、50000 集的《吃豆人》剧本后,自行领悟了游戏规则,进而可以设计出新的游戏关卡。


GameGAN 的论文在去年被计算机视觉顶会 CVPR 2020 收录。或许未来有一天,我们在游戏中打到的关卡,都是由 AI 随机生成的。

参考链接:
https://www.engadget.com/gan-theft-auto-192100564.html?src=rss_b2c
https://www.oschina.net/news/115995/gamegan-re-creates-pac-man-in-4-days

WAIC AI开发者论坛:后深度学习的AI时代


7月8日—10日,AI 开发者论坛将通过三大核心模块:AI开发者论坛WAIC· 开发者黑客松WAIC· 云帆奖展示本年度人工智能领域最前沿的研究方向和技术成果。

7月10日,AI开发者论坛邀请到多位业界大咖带来精彩分享:
  • 阿里巴巴副总裁、达摩院语言技术实验室负责人司罗

  • 上海交通大学特聘教授陈海波

  • 百度研究院量子计算研究所所长段润尧

  • RISC-V 国际开源 (RIOS) 实验室执行主任谭章熹

  • 类脑芯片研究领军人物 Giacomo Indiveri

  • 普林斯顿大学计算机科学系教授Yroam Singer


本次论坛主题涵盖大规模语言智能、SysML(机器学习系统)、多模态机器学习及大规模自动生成技术、RISC-V技术及生态、AI 原生计算机系统、量子人工智能、GPGPU等热门话题,满足 AI 开发者多层次的学习需求。


在精彩的分享外,我们还准备了RTX 3060 显卡、HHKB键盘、Air Tag、人工智能专业书籍、桌搭鼠标垫,现场签到即可参与抽取。


识别下方二维码,立即报名。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接