酷应用

报名 | AlphaGo Zero是如何实现无师自通的？

百家作者：机器之心 2017-10-28 04:28:57

「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文，由学术大咖带大家解读论文并展开讨论，在碎片化时代坚持深度阅读。

Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用 21 天达到 AlphaGo Master 水平。

AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读，我们邀请到深入浅出看懂 AlphaGo Zero 一文的作者，圣何塞州立大学研究生刘遥行，带大家揭秘 AlphaGo 的前世今生。

论文介绍

Mastering the Game of Go without Human Knowledge

@PaperWeekly 推荐

#Deep Reinforcement Learning

DeepMind 最新成果，无师自通下围棋。

论文链接

http://www.paperweekly.site/papers/942

嘉宾介绍

刘遥行，圣何塞州立大学研究生，幕布（mubu.com）实习生，关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。

论文共读

AlphaGo Zero 是如何实现无师自通的？

AlphaGo Zero

论文解读√在线讨论√

活动形式：语音直播

活动时间

10 月 29 日（周日）13:00-14:15

45 min 串讲 + 30 min 讨论

* 请在活动开始前完成论文精读

长按识别二维码，马上报名

* 报名成功后，关注系统弹出的公众号获取活动提醒

往期回顾

“阳奉阴违” 的半监督学习算法 - Virtual Adversarial Training

关于 PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 进行报名

关注公众号：拾黑（shiheibook）了解更多

[广告]赞助链接：

*文章为作者独立观点，不代表爱尖刀立场

本文由机器之心发表，转载此文章须经作者同意，并请附上出处( 爱尖刀 )及本页链接。

原文链接 https://www.ijiandao.com/2b/baijia/75870.html

AlphaGo Zero

图库

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

百度热搜榜

排名热点搜索指数