20篇最值得一读的深度推荐系统与CTR预估论文

百家 作者:AI100 2019-07-09 15:39:26


作者 | 深度传送门

转载自深度传送门(ID: gh_5faae7b50fc5) 

微博上近日流传一个段子,“2020年曾是各大科幻片中遥远的未来,但是现在离这个遥远的未来也只有6个月时间了”。只是借此感慨一下2019年转瞬之间半年的时间已经过去了,目前深度学习火热朝天,深度学习在推荐系统和CTR预估工业界的论文也是一篇接着一篇良莠不齐。

接下来主要总结一下2019年上半年工业界深度推荐系统与CTR预估上值得精读的论文。个人整理难免遗漏,也欢迎各位同行朋友评论另外哪些想额外推荐精读的论文。

1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google
作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;
论文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk

位列首位的当属Youtube推荐强化学习的两篇论文。虽然强化学习目前在推荐系统和CTR预估领域工业界由于系统复杂、效果未有显著提升等众所周知的原因确实不够成熟也尚未大规模应用起来。但是Youtube推荐的这两篇论文从某种程度上让强化学习的应用方向变得更明确了一些,而且作者在Industry Day上也宣称线上实验效果显示这个是YouTube单个项目近两年来最大的reward增长,也从某种程度上会激发各大公司的研究者们继续跟进的兴趣。

这是第一篇论文,提出了一种Top-K的Off-Policy修正方案将RL中Policy-Gradient类算法得以应用在动作空间数以百万计的Youtube在线推荐系统中。

2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google
作者:Eugene Ie, Vihan Jain, Jing Wang, ..., Jim McFadden, Tushar Chandra, Craig Boutilier;
论文:t.cn/AiKFHvYU

这是Youtube推荐应用强化学习的第二弹,主要贡献是提出了一种名为SLATEQ的Q-Learning算法,优化推荐系统里面同时展示给用户多个item情况的长期收益LTV(Long-term Value),将长期收益加入排序多目标中进行建模优化。重点在于与baseline使用的深度网络和输入特征都完全一样。详见:Youtube推荐已经上线RL了,强化学习在推荐广告工业界大规模应用还远吗?

3. Deep Learning Recommendation Model for Personalization and Recommendation Systems
作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,..., Bill Jia, Liang Xiong, Misha Smelyanskiy;
论文:t.cn/Ai0rIUd0;代码:t.cn/AiNGzCsY;解读:t.cn/AiOX38PL

FaceBook推荐最新论文,通过建模与系统协同设计提出一种butterfly-shuffle的机制来提升模型并行化,离线训练上在没有任何超参调优下收敛速度与准确率优于DCN,并开源了代码。

4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei
作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;
论文:t.cn/AipAFS3p

华为 at WWW 2019,提出基于卷积神经网络的CTR特征生成方法FGCNN,包含特征生成和深度分类器两部分,可以和任意CTR预估模型进行组合。

5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;
论文:t.cn/Ai0jTY68;代码:t.cn/Ai0jTY6u

阿里 at KDD 2019,提出DSTN模型用于点击率CTR预估,考虑更多空域与时域的辅助信息包括上下文展示过的ad以及历史点击/未点击ad来更好地预测目标item的点击率。从论文实验数据看,效果大幅度超过DeepFM和GRU,并开源了代码。

6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks
作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;
论文:t.cn/AipG8aXz;代码:t.cn/EI8Pnso

最新的深度CTR预估模型AutoInt,通过过Multi-head注意力机制将特征投射到多个子空间中,并在不同的子空间中捕获不同的特征组合形式,效果超过xDeepFM等达到最好。

7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent
作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin
论文:t.cn/AiOaAg1Q;解读:t.cn/AiOaAg1E

腾讯 at KDD2019,微信看一看团队对传统Look-alike进行了改造,提出实时Look-alike算法RALM,解决推荐系统多样性问题,效果好于YoutubeDNN。

8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;
论文:t.cn/AiN5T8Ks;TDM论文:t.cn/RQ5MrSg

还记得阿里 at KDD 2018的深度树匹配召回模型TDM吗?升级版JTM提出索引与模型同时优化的方案,大幅提升召回效果。

9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent
作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu
论文:t.cn/Ai09Dxkd;解读:t.cn/Ai09DxkB;数据资源:t.cn/Ai09Dxkr

腾讯 at KDD2019,构建了ConcepT概念挖掘标记系统,利用query搜索点击日志从用户视角提取不同的概念,以提高对短文本(query)和长文章(document)的理解,从而推动推荐,搜索等业务的提升。实验证明,ConcepT在 QQ 浏览器信息流业务中性能优异,曝光效率相对提升6.01%。

10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;
论文:t.cn/AiN9QZnV;代码:t.cn/AiN9QZnV

阿里 at IJCAI2019,考虑到不同用户行为序列的session内行为同构与session之间行为异构的特性提出了基于sesssion的CTR预估模型DSIN。使用self-attention机制抽取session内用户兴趣,使用Bi-LSTM针对用户跨session兴趣进行建模。

11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent
作者:Fuxing Hong, Dongbo Huang, Ge Chen;
论文:t.cn/Ai0WHak5;代码:t.cn/Ai0WHakt

腾讯 at AAAI2019,提出IFM通过特征以及特征组不同角度灵活学习特征间交互的重要性,并提出了通用的Interation-NN框架和DeepIFM来捕捉高阶交互,效果优于DeepFM并开源了代码。

12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall
作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, ..., Qiwei Chen, Wei Li, Dik Lun Lee
论文:t.cn/AiOao6I4;解读:t.cn/AiOao6I4

阿里天猫提出MIND模型通过Dynamic Routing的方法从用户行为和用户属性信息中动态学习出多个表示用户兴趣的向量,更好的捕捉用户的多样兴趣,来提升召回的丰富度和准确度,效果好于YoutubeDNN。

13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;
论文:t.cn/AiN4s4oe

阿里 at KDD2019,通过系统设计解决用户超长行为历史下CTR建模与在线预测性能瓶颈,效果好于GRU4Rec和DIEN。

14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft
作者:Mingxiao An,Fangzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie; 
论文:t.cn/Ai029G81

微软 at ACL 2019,LSTUR用于在新闻推荐任务中同时学习用户长期和短期的兴趣表示。模型的整体结构可分为新闻编码器、用户长期兴趣和短期兴趣模型、以及候选新闻的个性化分数预测模型,效果好于GRU4Rec。

15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019
作者:Chen Ma, Peng Kang, Xue Liu;
论文:t.cn/AipuFYkG;代码:t.cn/AipuFYkb

KDD2019,HGN提出通过feature与instance gating的多层级结构结合BPR来更好的捕获用户的长短期兴趣,效果好于GRU4Rec以及NextItRec。

16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba
作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou
论文:t.cn/Ai9JgWoJ;解读:t.cn/AiKBda4q

阿里巴巴搜索推荐事业部的新研究,首次使用强大的 Transformer 模型捕获用户行为序列的序列信号,供电子商务场景的推荐系统使用。原有DIN 提出使用注意力机制来捕获候选项与用户先前点击商品之间的相似性,但未考虑用户行为序列背后的序列性质。离线实验和在线 A/B 测试表明,BST 与现有方法相比有明显优势。目前 BST 已经部署在淘宝推荐的 rank 阶段,每天为数亿消费者提供推荐服务[2]。

17. Operation-aware Neural Networks for User Response Prediction
作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;
论文:t.cn/AiO2Dp5k;代码:t.cn/Ev4H3Jm

深度CTR预估新积木:PNN + FFM - FM = ONN模型,效果好于DeepFM和PNN。

18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba
作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;
论文:t.cn/AiNqPitA

Transformer引入推荐系统工业界,利用用户历史点击序列预测下一个点击item,效果超过GRU4Rec。

19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba
作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;
论文:t.cn/AiOLWp6x;

阿里 at SIGIR2019,胶囊神经网络应用于推荐提出CARP模型来从评论中更好地建模用户对商品的喜好程度,效果好于最新的ANR等。

20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;
论文:t.cn/Ai0jcGIZ;代码:t.cn/Ai0jcGIw

阿里 at IJCAI2019,提出DeepMCP模型通过匹配、关联、预测三个子模块更好地建模用户-ad,ad之间以及特征-CTR关系,效果优于DeepFM并开源了代码。


(*本文为 AI科技大本营转载文章,转载请联系原作者


精彩推荐



“只讲技术,拒绝空谈2019 AI开发者大会将于9月6日-7日在北京举行,这一届AI开发者大会有哪些亮点?一线公司的大牛们都在关注什么?AI行业的风向是什么?2019 AI开发者大会,倾听大牛分享,聚焦技术实践,和万千开发者共成长。


目前,大会盲订票限量发售中~扫码购票,领先一步!



推荐阅读

你点的每个“在看”,我都认真当成了喜欢

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接