南京维立志博完成近2亿元融资,昆药集团、华方资本领投
06-18
作者|陈大新 近日,RecSys官网公布了今年的最佳长短论文奖。来自腾讯PCG团队的四位作者唐红艳、刘军宁、赵明和宫旭东因开发了一种新的多任务学习个性化推荐模型而获得最佳长论文奖。
获奖论文:《Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personalized Recommendations》ACM RecSys(推荐系统会议)是一个国际会议,用于介绍推荐系统广泛领域的最新研究成果、系统和技术。推荐是一种特殊形式的信息过滤,它使用过去的行为和用户相似性来生成适合最终用户偏好的信息项列表。
RecSys汇聚了致力于推荐系统研究的主要国际研究小组以及许多世界领先的电子商务公司,因此它已成为展示和讨论推荐系统研究的最重要的年度会议。官网地址:本次还公布了五位最佳审稿人(Best Reviewers):Bart Goethals、Peter Knees、Scott Sanner、Steffen Rendle、Toine Bogers。
1 最佳长论文获奖论文:《Progressive Layered Extraction (PLE): A Novel Multi-Task Learning (MTL) Model for Personalized Recommendations》 论文作者:四位作者均来自腾讯 PCG 团队。论文链接:学习,MTL)已成功应用于很多推荐应用中。
然而,由于现实世界推荐系统中任务相关性的复杂性和竞争性,MTL 模型经常遭受负迁移性能下降的困扰。此外,通过对 SOTA MTL 模型的大量实验,我们观察到一个有趣的现象,即一个任务的性能通常通过影响其他任务的性能来提高。
为了解决这些问题,我们提出了一种具有新颖共享结构设计的渐进分层提取(PLE)模型:PLE显式分离共享组件和特定任务组,采用渐进路由机制逐步提取和分离深层语义知识,并改进它提高了通用环境下跨任务联合表示学习和信息路由的效率。在拥有 10 亿样本的腾讯视频推荐数据集上,我们将 PLE 应用于复杂相关和普通相关任务,从两个任务案例到多个任务案例的结果表明,在不同的任务相关性和任务组规模下,PLE 表现显着比最新的 MTL 模型更好。
此外,腾讯大型内容推荐平台对PLE的在线评测显示,与目前的SOTA MTL模型相比,观看次数增加了2.23%,观看时长增加了1.84%。这是模型的重大改进并证明了 PLE 的效率。
最后,对公共基准数据集的广泛离线实验表明,除了建议消除跷跷板现象之外,PLE 还可以应用于各种场景。目前,PLE已成功部署到腾讯在线视频推荐系统中。
2 篇最佳短文论文标题:《ADER: Adaptively Distilled Exemplar Replay Towards Continual Learning for Session-based Recommendation 》论文链接:《增强推荐集合的性能估计》论文链接:,使用额外的用户性能预测变量,例如用户做出的评分总数,以帮助确定每个基本推荐的用途整个系统贡献了多少?尽管如此,尽管手动区分预测器的成本很高,并且通常需要深入了解整体中每个建议的优点和缺点,但只观察到了微小的改进。为了克服这一限制,我们建议通过利用用户自己的历史评分来直接评估这些性能,而不是设计复杂的特征来预测给定用户的不同推荐的性能。
对来自多个领域的真实数据集的实验表明,使用性能估计作为附加特征可以显着提高 SOTA 积分器的准确性,与不使用它们相比,在 nDCG@20 中平均提高了 23%。 4项最佳长论文提名 在公布最佳长论文之前,RecSys在开幕式上提前公布了4项最佳长论文提名,如上图所示。
如上所述,第二篇论文获得了最佳长论文奖,第四篇论文获得了最佳长论文奖亚军。这里是第一篇提名论文的另一个介绍:《SSE-PT:Sequential recommendation via ressonalized transformer》论文链接:Davis(加州大学戴维斯分校)...论文简介:时间信息对于推荐问题至关重要,因为现实世界中用户偏好的变化是动态的。
深度学习的最新进展,尤其是在自然语言处理中广泛使用的 RNN 和 CNN 之外,已经发现了各种注意力机制和更新的架构,可以让每个用户更好地使用项目的时间顺序。特别是SASRec模型,受到自然语言处理中流行的Transformer模型的启发,取得了SOTA的结果。
然而,SASRec 与原始 Transformer 模型一样,本质上是一个非个性化模型,不包含个性化用户嵌入。为了克服这一限制,我们提出了一种个性化 Transformer (SSE-PT) 模型,该模型在 5 个真实世界数据集上的 NDCG@10 上的性能比 SASRec 高出近 5%。
此外,在研究了一些随机用户的参与历史之后,我们发现我们的模型不仅更容易解释,而且能够关注每个用户最近的参与模式。此外,通过对我们的 SSE-PT 模型 —>SSE-PT++ 进行轻微修改,它可以处理很长的序列,并在相当的训练速度下优于 SASRec,在性能和速度要求之间取得平衡。
我们对随机共享嵌入(SSE)正则化的新颖应用是个性化成功的关键。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-06
06-18
最新文章
【玩转GPU】ControlNet初学者生存指南
【实战】获取小程序中用户的城市信息(附源码)
包雪雪简单介绍Vue.js:开学
Go进阶:使用Gin框架简单实现服务端渲染
线程池介绍及实际案例分享
JMeter 注释 18 - JMeter 常用配置组件介绍
基于Sentry的大数据权限解决方案
【云+社区年度征文集】GPE监控介绍及使用