酷应用

新闻
- 看点
- 观点
- 读点
- 热点
科技
- 数码
- 软件
- 应用
- 极客
企服
- 电商
- 运营
- 移动
- 访谈
- 动态
- 招聘
- 访谈
- 百家
安全
- 业界
- 快讯
- 技术
- 校园
- 工具
文娱
- 明星
- 影视
- 音乐
- 网娱
- 韩娱
- 词典
游戏
- 手游
- 页游
- 端游
好货
- 报道
- 值得买
- 健康

你玩《2048》能拿多少分？AI的最高分纪录：401912

百家作者：量子位 2020-06-23 09:50:03

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI

如果让AI来玩《2048》这样的游戏，那会是怎样一种画面？

现在，有人用强化学习方法实践了起来。

于是，插上DQN的翅膀，AI从零起步，自己琢磨出了《2048》的玩法：

一起手，是不是就有内味了？

这操作，条理清晰到令人感到舒适。“1000，no；1024，yes”的强迫症们不禁纷纷点赞，给这只AI贡献了800+ reddit热度。

用DQN玩《2048》

调教出这只会玩《2048》的AI的，是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。

首先，他采用OpenAI Gym构建了自定义强化学习环境。

其中包括两种2048棋盘表示方式：

二进制——使用二次幂矩阵表示棋盘中的每一块区域
非二进制——原始数字矩阵

模型包含两种类型的神经网络：CNN和MLP（多层感知机）。

据Felipe介绍，与MLP相比，以CNN作为特征提取器的智能体表现得更好。

训完之后，老哥测试了一下，在1000把游戏中，AI有100次达到了2048。

玩《2048》的AI们

目前，这只用DQN训练出的AI玩到2048就打住了。

不过，巴西老哥抛砖，又吸引了不少来献玉的盆友。

比如，同样采用强化学习方法，将时序差分学习和最大期望搜索相结合的2048控制器。

在10步/秒的策略下，它最高能凑出32768。

而在追求高分的路上，有一位来自日本的选手表现亮眼。

依靠7个卷积层的深度卷积网络，这只在《2048》这个游戏中最高拿到了401912分。

正如一位网友所说：这正是一个足够有趣，又不太复杂的强化学习案例。

如果你是刚刚开始学习强化学习，也不妨拿这个小项目练练手~

参考链接

《2048》相关开源项目：
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/

相关论文：
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

「数据库」系列公开课开启，快来免费报名！

6月23号第二期直播，浪潮信息数据库产品线总经理--乔鑫分享「传统企业互联网下的数据平台升级」，将讲述HTAP数据库的技术原理、优化方案以及开发部署概要等技术问题，以此带给广泛关注者一些前瞻指导。

扫码报名，可加入直播交流群，还可获取系列课程直播回放、分享PPT：?

量子位?QbitAI · 头条号签约作者

?'?' ? 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

关注公众号：拾黑（shiheibook）了解更多

[广告]赞助链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
让资讯触达的更精准有趣：https://www.0xu.cn/

*文章为作者独立观点，不代表爱尖刀立场

本文由量子位发表，转载此文章须经作者同意，并请附上出处( 爱尖刀 )及本页链接。

原文链接 https://www.ijiandao.com/2b/baijia/369384.html

图库

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

百度热搜榜

排名热点搜索指数