张子柯
社会标签网络建模:基于超图结构的网络增长模型
2010-11-19 17:41
阅读:6876

记得差不多在两年以前,我在投递第一篇利用社会标签信息进行推荐的论文时(有兴趣的读者可以参考之前的博文:最近的一个工作被国际同行所关注),审稿人曾经问过我们: 这种人为的将三元结构分割为两个二元结构,再通过参数拟合的方式将这两个结构结合起来的方法,是否会造成信息的损失?当时的我还处于科研懵懂时期,虽然觉得审稿人说的很有道理,却也不知道如何解决这个问题。于是也就搁置下来,再后来我的师兄(07年毕业)Marcel回弗里堡做报告时,提到超图(Hypergraph)的概念,让我联想到超图就可以完美的刻画标签网络中一条边包含多节点的问题。基于这个想法,我开始思考基于超图的标签网络的结构应该如何展现。不幸的是,09年PRE的两篇文章PRE 79 (2009) 066118和PRE 80 (2009) 036118 已经抢先讨论了这个问题。失望之余,我和华东理工大学的博士生刘闯一起转而开始思考标签网络建模的问题,并试图通过建模的方法来重现标签网络中的超图结构。在这个模型中,我们主要考虑标签的两种功能:管理(概率p)和检索(概率1-p)。前者是为了让用户更容易的有效管理自己的物品(书签、音乐等),后者是为了让用户能迅速的从检索出自己所潜在喜欢的物品。 

令人比较开心的是,模型的结果还比较理想,能够很好的再现标签网络中的:超度分布、超度-簇系数分布、和节点距离排序。模型结果显示: 对于Del.icio.us这样user-driven的标签网络,用户更倾向于使用标签的管理功能(表现为p=0.8)。总体而言,这个模型算是比较好的揭示了标签网络的结构增长机制,也同时为解决博文篇头所描述“如何利用标签网络的完整信息进行推荐(这个工作正在进行中)”打下了理论基础。


诸位若有兴趣,请看后附全文!
 
A hypergraph model of social tagging networks

转载本文请联系原作者获取授权,同时请注明本文来自张子柯科学网博客。

链接地址:https://wap.sciencenet.cn/blog-210641-385483.html?mobile=1

收藏

分享到:

当前推荐数:4
推荐人:
推荐到博客首页
网友评论11 条评论
确定删除指定的回复吗?
确定删除本博文吗?