Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 

香港大学推出 EasyRec,零样本推荐性能大幅提升

2024-08-29

2024 年 8 月 28 日,香港大学推出了最新的推荐系统 EasyRec,该系统结合了语言模型的语义理解能力和协同过滤技术,在零样本学习场景下的推荐性能有所提升。EasyRec 通过整合用户和物品的文本描述,生成语义嵌入,实现个性化且适应性强的推荐。EasyRec 旨在克服深度协同过滤模型在处理新用户或新商品时的挑战,即使在没有先前交互数据的情况下,也能提供推荐。

EasyRec 的模型架构基于多层双向 Transformer 架构,如 BERT,专注于生成文本表示。通过自注意力机制,模型能够捕捉上下文信息。模型训练采用对比学习方法,通过优化包含用户和商品交互的特征空间,增强模型的推荐性能。此外,模型引入了文本掩码 – 重构损失以提高语义理解和泛化性能。

在零样本推荐能力方面,EasyRec 通过利用语言模型来生成用户和商品的文本画像,实现了基于文本的零样本推荐。语言模型在自然语言处理(NLP)领域展示了语义理解能力,可以将文本编码成特征向量,获取一个统一的特征分布空间。这一特性使得模型无需用户和商品 ID 便可以提供推荐。

对于一个新用户和一个新商品,系统会通过其文本描述生成文本嵌入向量,然后通过余弦相似度计算它们之间的交互概率。最终,系统根据相似度得分为用户推荐商品。

在模型性能与对比实验方面,作者训练了三个版本的模型(从 Small 到 Large),模型的性能体现出了 Scaling Laws。作者同样测试了不同的语言模型对现有的 ID-based 的协同过滤算法增强的效果。其中,选用了两个广泛使用的模型 GCCF 和 LightGCN 作为 baseline,并且利用了当前先进的文本增强框架 RLMRec 作为统一的框架进行实验。从实验中可以看出,EasyRec 相较于 baseline 有所提升。

在数据集构建与实验验证方面,作者利用 Amazon Review Data 中不同类别的数据(例如艺术、体育等等)构建了训练数据集以及部分数据集,同时引入了 Steam 和 Yelp 数据集作为跨平台的测试数据集。为了验证模型在零样本环境下的性能,作者将训练数据集和测试数据集进行划分,使得他们是完全不同的数据,没有任何用户和商品上的交集。

为了增强模型对于未知用户和物品的泛化能力,作者采用了画像多样化增强的策略。通过对现有的用户和商品画像进行增强,让每个实体都能通过多个画像文本来展现其交互偏好。

EasyRec 通过结合语言模型和对比学习,提供了推荐解决方案,既能够处理零样本推荐,也能提高基于协同过滤的推荐性能。

AI 日报

查看全部日报

  • AI 技术在医疗领域的突破性应用:从诊断到治疗的全新变革
  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!

©2025 毫河风报 沪ICP备18012441号-5