Information filtering via preferential diffusion
Linyuan Lü and Weiping Liu
Phys. Rev. E 83, 066119 (2011)
Recommender systems have shown great potential in addressing the information overload problem, namely helping users in finding interesting and relevant objects within a huge information space. Some physical dynamics, including the heat conduction process and mass or energy diffusion on networks, have recently found applications in personalized recommendation. Most of the previous studies focus overwhelmingly on recommendation accuracy as the only important factor, while overlooking the significance of diversity and novelty that indeed provide the vitality of the system. In this paper, we propose a recommendation algorithm based on the preferential diffusion process on a user-object bipartite network. Numerical analyses on two benchmark data sets, MovieLens and Netflix, indicate that our method outperforms the state-of-the-art methods. Specifically, it can not only provide more accurate recommendations, but also generate more diverse and novel recommendations by accurately recommending unpopular objects.
一个好的推荐算法不仅要有高的精确度(即推荐的东西用户喜欢)也要有一定的多样性。这里的多样性有两个方面:
1) 针对一个用户而言的多样性:推荐算法能够找到用户喜欢的冷门item的能力。比如我喜欢动画片,如果推荐系统给我推荐了《功夫熊猫2》我肯定喜欢(高精确度),但是我并不满意这次推荐,因为对于这种热片我早已在电影院看过了。相比较如果能给我推荐一部我不知道的动画片,又符合我的口味,那么这次推荐就是相当成功的。我们用Intrasimilarity刻画这种多样性。一个用户的推荐列表中推荐产品的相似性越低表示推荐多样性越高。PD算法在此方面具有优势。
一个好的推荐算法能够开拓用户的视野,就像一个凹透镜可将用户的兴趣发散出去,当然这种发散也最好是在不影响精度的前提下进行。
2) 用户间的推荐多样性:针对不同用户的推荐尽可能的不同。这个指标用两个推荐列表的Hamming距离衡量,即在长度为L的两个推荐列表中有多少是不同的item。显然此值越大表示越多样。
给定推荐列表长度L,针对一种推荐算法统计推荐的结果中不同的item数目,以及每个item被推荐的次数Q,按照Q从大到小排序得到下图。其中NBI为最基本的物质扩散算法[PRE 76, 046115 (2007)],HPH为物质扩散和热传导的混合算法[PNAS 107, 4511 (2010)]。可以看出,相比较NBI和HPH,PD能够推荐更多不同的item给用户。例如在MovieLens数据集上,当L=50时,NBI只能推荐293个item,HPH可以推荐787个,而PD可以推荐上千种产品。在Netflix上,PD可以推荐5000以上的产品。由于Neflix一共才5586个item,这意味着几乎所有的item都有机会被推荐。由此可见,PD能够产生更加多样性的推荐结果。
推荐系统的大部分研究过分强调了推荐的精确性而忽略了多样性问题。然而精确的推荐不一定是用户满意的推荐。用户更喜欢新奇的体验,从而在很大程度上提高系统的粘性。虽然已经有一些指标刻画推荐的满意度,如half-life utility,但是这些指标是否能够反应真实系统中用户的体验感呢?如何设计以用户体验为中心的推荐系统仍然是一个长期具有挑战的的问题。
转载本文请联系原作者获取授权,同时请注明本文来自吕琳媛科学网博客。
链接地址:https://wap.sciencenet.cn/blog-329471-461274.html?mobile=1
收藏