在这个信息爆炸的时代,推荐系统在我们的日常生活中扮演着越来越重要的角色。无论是新闻推送、电商购物还是短视频推荐,都离不开推荐系统的支持。然而,传统的推荐算法往往无法很好地区分用户的长期兴趣和短期兴趣,这严重影响了推荐的准确性。最近,清华大学和快手科技的研究人员提出了一种新的方法,通过对比学习框架实现长短期兴趣的分离,大大提升了推荐效果。让我们一起来看看这项突破性的研究。
长短期兴趣:用户偏好的两个维度
在推荐系统中,准确把握用户兴趣至关重要。但用户的兴趣是复杂多变的,通常可以分为两个方面:
- 长期兴趣:反映用户相对稳定的偏好,可能会持续较长时间。例如,一个用户长期以来都喜欢浏览电子产品。
- 短期兴趣:体现用户近期的动态偏好,变化较快。比如用户最近突然对服装产生了兴趣。
准确区分和建模这两种兴趣,对提高推荐效果至关重要。然而,现有的方法往往将长短期兴趣混杂在一起建模,难以真正分离开来。这不仅影响了推荐的准确性,也使得推荐结果难以解释。
现有方法的局限性
目前主流的推荐算法大致可以分为以下几类:
- 基于协同过滤的方法:主要捕捉用户的长期兴趣,但忽视了序列特征,难以建模动态的短期兴趣。
- 序列模型:利用CNN或RNN等网络学习序列特征,但往往只关注短期记忆,容易忽视长期兴趣。
- 混合方法:结合协同过滤和序列模型,试图同时捕捉长短期兴趣。但由于缺乏显式的监督,学到的长短期兴趣表示往往还是纠缠在一起的。
这些方法的共同问题在于:没有针对长短期兴趣设计独立的建模机制,也没有专门的监督信号来指导长短期兴趣的分离。这就导致了学到的兴趣表示难以真正区分长短期特征。
CLSR:基于对比学习的长短期兴趣分离框架
为了解决上述问题,研究人员提出了一种新的对比学习框架CLSR(Contrastive Learning for Short and Long-term interests in Recommendation)。该框架的核心思想是:通过自监督的方式,利用用户的交互序列构建长短期兴趣的代理表示,并通过对比学习实现长短期兴趣的有效分离。具体来说,CLSR包含以下几个关键组件:
1. 独立的长短期兴趣编码器
CLSR设计了两个独立的编码器,分别用于捕捉长期兴趣和短期兴趣:
- 长期兴趣编码器:采用注意力池化机制,从用户的全部历史交互中提取长期兴趣表示。
- 短期兴趣编码器:基于RNN和注意力机制,从用户最近的交互序列中捕捉动态变化的短期兴趣。
这种设计使得长短期兴趣可以被独立地建模,为后续的分离奠定了基础。
2. 基于交互序列的自监督
CLSR的一大创新在于,它利用用户的交互序列自动构建长短期兴趣的代理表示,作为自监督的信号。具体而言:
- 长期兴趣代理:用户全部历史交互的平均表示
- 短期兴趣代理:用户最近k个交互的平均表示
这些代理表示虽然简单,但能很好地反映长短期兴趣的特征,为后续的对比学习提供了有效的监督信号。
3. 对比学习任务
有了代理表示作为”伪标签”,CLSR设计了成对的对比学习任务:
- 使长期兴趣编码器的输出与长期兴趣代理更相似
- 使短期兴趣编码器的输出与短期兴趣代理更相似
这种对比学习机制能有效地引导模型学习到更好地分离的长短期兴趣表示。
4. 自适应融合网络
为了在最终预测时合理利用长短期兴趣,CLSR设计了一个基于注意力的融合网络。该网络能根据目标物品和用户历史,自适应地调整长短期兴趣的重要性,从而做出更准确的预测。
实验结果:显著提升推荐效果
研究人员在电商和短视频推荐两个大规模真实数据集上进行了实验。结果表明,CLSR在各项指标上都显著优于现有的最先进方法:
- AUC和GAUC提升超过0.02
- NDCG提升超过10.7%
这样的提升幅度在推荐系统领域是非常可观的。
更重要的是,研究人员还通过反事实分析验证了CLSR在长短期兴趣分离方面的效果。他们人为地干预用户的历史交互序列,阻断长期或短期兴趣的信息。结果显示,CLSR能够稳定地实现更强的长短期兴趣分离,远超现有方法。
总结与展望
CLSR框架巧妙地利用对比学习和自监督,解决了长短期兴趣分离这一关键问题。它不仅显著提升了推荐效果,还为推荐系统的可解释性和可控性开辟了新的方向。
未来的研究可以在以下几个方面进一步拓展:
- 设计更复杂的长短期兴趣代理表示,进一步提升自监督效果
- 将CLSR框架应用到更多推荐场景,如新闻、音乐等领域
- 探索如何利用分离的长短期兴趣实现更精细的推荐控制和解释
总的来说,CLSR为推荐系统的发展提供了一个全新的范式,相信会激发出更多创新性的工作。