ICML 2020线上分享 | Google AI:如何用ConQUR算法解决强化学习在应用落地上的难题?

百家 作者:机器之心 2020-07-11 15:23:52
ICML(International Conference on Machine Learning)是国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议,每年都会吸引大批 ML 研究者参加。

受到疫情影响,今年的 ICML 大会已经改为在 2020 年 7 月 13 日至 18 日线上举行。


据官方统计,ICML 2020 共收到 4990 篇论文投稿,最后接收论文 1088 篇,接收率为 21.8%。与往年相比,接收率逐年走低。

为向读者们分享更多 ICML 的优质内容,在大会开幕之前,机器之心将策划多期线上分享。

这是机器之心 ICML 2020 线上分享的第一期,我们邀请到了普林斯顿大学在读博士生 DiJia Su 为我们分享他们今年被接收的最新论文:《ConQUR: Mitigating Delusional Bias in Deep Q-learning》

Google AI 如何用 ConQUR 算法解决强化学习在应用落地上的难题


讲师简介:DiJia Su(苏迪加) ,本论文的第一作者,目前在普林斯顿大学攻读博士,研究方向是人工智能与强化学习。他本科毕业于 UBC 工程系,后在加州理工获得了硕士学位,曾在 Amazon AI,Uber AI Lab 与 Google AI Lab 担任过人工智能研究员。Dijia Su 平时也积极参与普林中国学生会,担任副主席的职位。

演讲概要:众所周知,强化学习在应用落地和理论之间存在巨大的偏差,理想很美好,现实很骨感。作者与 Google AI 团队围绕这个复杂的问题上提出了 ConQUR 算法框架,有效地解决强化学习在部署落地中面临的各种问题。

在实际应用场景中,深度学习,神经网络与 Q-learning 的结合会导致其在某种状态 (state) 采取「非合理」 的动作。在这次演讲中,作者将讲解如何通过修改一行代码从而实现强化学习 (Q-learning 或相关算法) 性能上显著的提高。此论文为 NeurIPS 2018 Best Paper (Non delusional Q-Learning)的延续。作者也将分享他是如何与原版人马打造 ConQUR 算法并通过现实应用场景,结果强化学习落地的难题。

论文链接:https://arxiv.org/pdf/2002.12399.pdf

直播时间:7 月 14 日 20:00-21:00

ICML 2020 机器之心线上分享

在 ICML 2020 收录的大量优秀论文中,我们将选出数篇优质论文,邀请论文作者来做线上分享。整场分享包括两个部分:论文解读和互动答疑。

线上分享将在 「ICML 2020 交流群」 中进行,加群方式:添加机器之心小助手(syncedai6),备注「ICML」,邀请入群。入群后将会公布直播链接。
 

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接