兼顾公平与效率?北大NeurIPS 19论文提出多智能体强化学习方法FEN
机器之心报道
机器之心编辑部
近日,北京大学卢宗青团队提出了一种新的多智能体强化学习方法 Fair-Efficient Network(FEN,「分」),用于多个智能体学习提升系统效率并同时保持公平。这一新方法对任务调度、马太效应和工厂生产等实际情景具有重要意义,该论文已被人工智能顶会 NeurIPS 2019 录用。
提出 fair-efficient reward,用于学习效率与公平。
提出一种 hierarchy 架构,降低学习难度。
提出 FEN 的分布式训练方法。
Job Scheduling 环境中存在 4 个智能体和 1 个资源,智能体占据资源会获得奖励,资源在同一时刻只能被一个智能体占据。
The Matthew Effect 环境中存在 10 个 Pac-men 和若干 ghosts。Pac-man 吃掉 ghost 会获得奖励,并且体积和速度变大,更容易吃其他 ghost,因此强者越强。
Manufacturing Plant 环境中存在 5 个智能体和不同种类的矿石,每个智能体采集不同的矿石来生产不同的零件,最终的产量取决于数目最少的零件。
Sub-policies 能够远离三个 ghosts 来保持公平。
三个 sub-policies 分布互不相同,达到了信息论目标的预期。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号
随时掌握互联网精彩
随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 习近平向亚太经合组织峰会发表演讲 7929854
- 2 中铁七局道歉 7915032
- 3 俄飞行员:单枪匹马来 独自驾机回 7825588
- 4 中国对亚太经济增长贡献率达64.2% 7763205
- 5 云南豌豆尖120元1公斤热销韩国 7657365
- 6 少林寺方丈在联合国气候大会发声 7596544
- 7 男子裹6床被子卡进床缝出不来 7494883
- 8 城中村改造扩围至近300个城市 7350139
- 9 全国冰冻线进程图 7294210
- 10 小行业潜藏“大能量” 7198297