巧妙利用大语言模型,可以从用户的历史行为中推出用户的显示兴趣,再将其结构化为图信息,用于提升商品推荐的精度。从大模型中低成本获得新的特征,提升各类模型在不同场景中的表现,是一个有趣且实用价值很大的研究方向。
动机:用户侧结构化信息缺失的难题
在推荐系统领域,知识图谱(Knowledge Graph, KG)的引入为整合商品侧的额外信息提供了强有力的支持。当前的通用范式是将知识图谱与包含用户-物品交互信息的协同图(Collaborative Graph, CG)[1]相结合,形成协同知识图谱(Collaborative Knowledge Graph, CKG),并在CKG上设计知识感知的图推荐算法,以充分利用商品侧的丰富信息[2]。然而,一个长期被忽视的关键问题在于:如何将用户侧的知识以结构化的形式融入CKG? 传统用户特征(如年龄、性别、国籍等)过于粗糙,难以捕捉用户的深层次相似性;而用户兴趣本身又是隐性且复杂的,难以直接提取并结构化地整合到推荐算法中。这种“用户侧知识鸿沟”成为了制约知识图推荐发展的一个难题。
图1 从传统的协同图谱(CG),到协同知识图谱(CKG),再到协同兴趣知识图谱(CIKG)
论文创新:CIKG的构建与两大核心模块
受近年来大语言模型(Large Language Models, LLMs)飞速发展的启发,我们提出了一种全新的框架——协同兴趣知识图谱(Collaborative Interest Knowledge Graph,CIKG),即融合用户显式兴趣的协同知识图谱。这一框架利用LLM强大的语言理解和推理能力,从用户的历史行为中推导出显式的用户兴趣特征,并将其结构化为图信息,融入CKG,从而实现用户侧外部知识的引入和结构化增强。外部结构化知识引入推荐域的演进路线如图1所示。
图2 CIKGRec整体架构图。从左到右依次是用户兴趣构建模块和推荐模块
然而,由于LLM的幻觉问题以及外部知识的复杂性,基于CIKG的图推荐方法面临两大挑战:(1)噪声干扰:LLM生成的内容中可能存在噪声,影响推荐系统的准确性。(2)知识迁移困难:用户侧知识与商品侧知识向推荐域的迁移过程存在障碍,导致知识利用率低。为应对上述挑战,我们设计了两个核心模块,并提出了对应的推荐方法 CIKGRec 。整体模型架构如图2所示。以下详细介绍两大核心模块的功能与设计思路:
Ø 用户兴趣重建模块:为应对LLM的幻觉问题,我们设计了一个基于图掩码自编码器(GMAE)的用户兴趣重建模块。该模块通过基于课程学习策略的动态调整掩码率(从低到高逐步增加任务难度),有效过滤了LLM生成内容中的噪声,同时保留了关键的兴趣信息。这相当于为推荐系统安装了一个“信息净化器”。
Ø 跨域对比学习模块:为实现用户侧知识与商品侧知识向推荐域的有效迁移,我们提出了一个跨域对比学习模块。该模块通过最大化用户侧和商品侧知识在推荐域中的互信息,提升了知识迁移的准确性和有效性。这相当于为知识迁移搭建了一座“智能桥梁”。
表1 总体实验结果
实验验证:
我们在三个真实世界数据集(DBbook2014、Book-Crossing、MovieLens-1M)上进行了实验验证,使用GPT-3.5作为用户兴趣推理模型。实验结果如表1所示。根据实验结果,我们有如下观察:
Ø 优异的推荐表现 :我们的方法在所有数据集上均表现出色,尤其是在两个更加稀疏的数据集(DBbook2014和Book-Crossing,稠密度分别为0.44%和0.19%)上表现更加突出。这充分证明了我们方法的整体优越性,以及我们提出的利用LLM进行用户侧兴趣增强框架的有效性。
Ø 用户侧知识引入的价值 :我们发现,传统的基于知识的推荐方法在物品侧知识稀疏的数据集Book-Crossing(物品侧知识统计信息详见论文原文表2)上表现较差,而我们的方法却能始终保持优异的性能。这表明,我们的方法能够有效引入用户侧知识,弥补物品侧知识稀疏的不足,并实现高效的利用,从而显著提升推荐系统的整体表现。
总结:
本研究通过引入用户侧知识,填补了知识图推荐中存在的用户侧结构化信息缺失的空白,显著提升了稀疏数据场景下的推荐性能。同时,提出的CIKG框架和核心模块为结合LLM的推荐系统研究提供了新的思路。
² 论文信息:Hu Z, et al. Bridging the user-side knowledge gap in knowledge-aware recommendations with large language models, in Proceedings of the AAAI Conference on Artificial Intelligence. 2025, 39(11): 11799-11807.
² 原文链接:https://ojs.aaai.org/index.php/AAAI/article/view/33284
² 论文代码:https://github.com/laowangzi/CIKGRec
参考文献
[1] Zhang Z K, Zhou T, Zhang Y C. Personalized recommendation via integrated diffusion on user–item–tag tripartite graphs. Physica A: Statistical Mechanics and its Applications, 2010, 389(1): 179-186.
[2] Wang X, et al. KGAT: Knowledge graph attention network for recommendation, in Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019: 950-958.
转载本文请联系原作者获取授权,同时请注明本文来自周涛科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3075-1484349.html?mobile=1
收藏