兼顾公平与效率?北大NeurIPS 19论文提出多智能体强化学习方法FEN
机器之心报道
机器之心编辑部
近日,北京大学卢宗青团队提出了一种新的多智能体强化学习方法 Fair-Efficient Network(FEN,「分」),用于多个智能体学习提升系统效率并同时保持公平。这一新方法对任务调度、马太效应和工厂生产等实际情景具有重要意义,该论文已被人工智能顶会 NeurIPS 2019 录用。
提出 fair-efficient reward,用于学习效率与公平。
提出一种 hierarchy 架构,降低学习难度。
提出 FEN 的分布式训练方法。
Job Scheduling 环境中存在 4 个智能体和 1 个资源,智能体占据资源会获得奖励,资源在同一时刻只能被一个智能体占据。
The Matthew Effect 环境中存在 10 个 Pac-men 和若干 ghosts。Pac-man 吃掉 ghost 会获得奖励,并且体积和速度变大,更容易吃其他 ghost,因此强者越强。
Manufacturing Plant 环境中存在 5 个智能体和不同种类的矿石,每个智能体采集不同的矿石来生产不同的零件,最终的产量取决于数目最少的零件。
Sub-policies 能够远离三个 ghosts 来保持公平。
三个 sub-policies 分布互不相同,达到了信息论目标的预期。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 中拉十年合作跑出“加速度” 7903930
- 2 国台办回应特朗普突然提到“统一” 7808575
- 3 外交部:中方对美芬太尼反制仍然有效 7712277
- 4 这次部长级会议为何多国元首都来了 7616322
- 5 多名在英国中国公民失踪失联 7521960
- 6 印巴谁赢了?发布会这7秒说明了很多 7429282
- 7 特朗普访问中东 此行瞄准的是啥 7328352
- 8 日本餐饮公司就拒绝接待中国人道歉 7236472
- 9 93年女子嫁65年丈夫 当事人发声 7139180
- 10 知名女演员重病归来 曾四登春晚 7047363