报名 | AlphaGo Zero是如何实现无师自通的?
「论文共读」是由 PaperWeekly 发起的协同阅读小组。我们每周精选一篇优质好文,由学术大咖带大家解读论文并展开讨论,在碎片化时代坚持深度阅读。
Google DeepMind 团队在 Nature 上发表的最新论文,阐述了新版 AlphaGo 是如何从空白状态学起,不使用任何人类棋谱,通过自对弈强化学习,仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo,并用 21 天达到 AlphaGo Master 水平。
AlphaGo Zero 的核心在于强化学习下的自我博弈。本期论文共读,我们邀请到 深入浅出看懂 AlphaGo Zero 一文的作者,圣何塞州立大学研究生刘遥行,带大家揭秘 AlphaGo 的前世今生。
论文介绍
Mastering the Game of Go without Human Knowledge
@PaperWeekly 推荐
#Deep Reinforcement Learning
DeepMind 最新成果,无师自通下围棋。
嘉宾介绍
刘遥行,圣何塞州立大学研究生,幕布(mubu.com)实习生,关注人工智能和现实生活的工业结合、人工智能和区块链技术的联合应用。
论文共读
AlphaGo Zero 是如何实现无师自通的?
AlphaGo Zero
论文解读√在线讨论√
活动形式:语音直播
活动时间
10 月 29 日(周日)13:00-14:15
45 min 串讲 + 30 min 讨论
* 请在活动开始前完成论文精读
长按识别二维码,马上报名
* 报名成功后,关注系统弹出的公众号获取活动提醒

往期回顾
“阳奉阴违” 的半监督学习算法 - Virtual Adversarial Training
关于 PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 进行报名
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 习近平将发表二〇二六年新年贺词 7904141
- 2 2026年国补政策来了 7808738
- 3 东部战区:开火!开火!全部命中! 7712893
- 4 2026年这些民生政策将惠及百姓 7616985
- 5 小学食堂米线过期2.5小时被罚5万 7519709
- 6 解放军喊话驱离台军 原声曝光 7428214
- 7 为博流量直播踩烈士陵墓?绝不姑息 7327605
- 8 每月最高800元!多地发放养老消费券 7238391
- 9 数字人民币升级 1月1日起将计付利息 7141831
- 10 2026年1月1日起 一批新规将施行 7040675








机器之心
