|
2016年和候磊合作的一个工作。
二部分网络中的用户、产品的相似性度量是个性化推荐算法,模式识别等应用的基础。当前主要应用的基于二部分网络结构的相似性度量方法有二十多种,然而,不同的相似性度量方法对不同的网络结构得到的用户相似性结果迥异。对同一数据集不同时段的数据,度量结果也相差很大。这些相似性的变化极大地影响了个性化推荐算法的应用。
考虑到用户-产品二部分网络中产品属性不会随网络结构发生变化的事实,本文考察了已有的十余种相似性随网络结构变化的稳定性变化趋势。首先,把实证数据随机分成两部分,计算两部分数据集上不同产品之间相似性的差异。在不同数据集上的实验结果表明,这些相似性指标的均值和散度分布具有相似的特性,进一步分析发现相似性可以大致分为三类,其中每一类的相似性指标都具有相似的数学形式。进一步,提出了基于相似性稳定性的个性化推荐算法,实验结果表明,考虑相似性稳定性的推荐算法可以大幅度提高推荐的准确性和多样性。更重要的是,该方法可以保证在线的运行结果和线下的实验结果具有相同的表现。
论文在审稿的时候得到了审稿人的极大肯定。考虑到相似性度量是很多领域的基本工具,审稿人建议我们多引用模式识别,机器学习的论文,让相关领域的科学家都能关注到我们的工作。反倒是我们自己没有注意宣传。
http://www.nature.com/articles/srep18653
Scientific Reports 6, 18653 (2016).pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-15 15:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社