智商情商网熵田园分享 http://blog.sciencenet.cn/u/Liweigang 数字之美,美于形式,更在内涵。

博文

微博de故事:物理学者对计算机科学同行的批评 精选

已有 11725 次阅读 2013-1-2 08:29 |个人分类:社交网络|系统分类:科研笔记| 物理, 微博, 计算机科学, 复杂网络系统, 微博研究

微博,亦称在线社交网络,具有动态变化、在线即时、异构互联和大数据生成等特点。其机制研究基于浩瀚网络拓扑、海量数据处理和多重关系分析等,面临着理论建模和技术实践的各项挑战。世界若干著名智能网络、数据挖掘和复杂系统等研究中心,无不投入大量人力物力,从事这方面研究。


不妨列出笔者研读的一些经典文献,多少反映出社交网络研究特点:Jiawei Han团队等提出异构信息网络理论(Heterogeneous Information Networks),对大型信息技术文献库DBLP的论文引用和共同作者进行预测[1]。亚洲微软Haixun Wang团队提出十亿节点巨型网络子图匹配(Subgraph Matching on Billion Node Graphs)的分布式优化算法,大大提高了网络咨询分析效率[2]。加州大学圣塔芭芭拉分校的Ben Y. Zhao 团队注重在线网络大尺度和多层次的动态特性(Multi-scale Dynamics),研究微博海量信息分布和传播机制[3]。斯坦福大学Jure Leskovec团队提出多元素、多关系的新型图论模型(Multiplicative Attribute Graph Model),使之广泛有效应用于多种网络研究[4]

 

国内的不少学者和机构也在相关方面作出卓有成效的工作,例如中国原子能科学研究院方锦清团队极力推动社交网络研究;  清华大学唐杰团队开发应用大型文献库并付诸于实;华东师大周傲英团队和四川大学唐常杰团队在大数据和知识发现等方面的工作,等等。另外,一些物理学家从复杂网络系统角度,研究社交网络相关模型,果实喜人,可圈可点,如中科大汪秉宏团队和电子科技大学周涛团队,等等。2012年参加WISE新浪微博竞赛的若干团队,也在信息咨询和转发预测等方面,进行较全面的研究。

 

尽管微博发展势如破竹,机制研究捷报频传,但一些物理学相关方向的研究人员对计算机科学和工程技术人员的工作不以为然。两位年轻的物理专业学者在对复杂网络系统研究时,于2011年在物理期刊《Physica AStatistical Mechanics and its Applications》上介绍有关链路预测问题研究成果[5]。该文中在谈到一些相关数学模型时,顺便对计算机科学同行的工作提出议论,也可以说是批评吧。为便于读者了解问题所在,笔者不妨摘录和翻译有关内容如下:

 

链路预测问题在现代信息科学富有长期性的挑战,计算机科学界已提出不少基于马尔可夫链模型和统计模型的算法。但是,他们的研究并没有赶上目前复杂网络的研究进展,尤其是他们缺乏认真考虑网络的结构特点,然而(来自其它领域的,笔者注)层次的组织[21]和社区的结构[22],这些研究实实在在地为链接预测提供有用的信息和见解。近期出现的一些物理学方法,如随机游走过程和最大似然方法等,已有效应用在链接预测。本文将详细讨论这些新的发展[5]

 

此段中文文字仅为参考,如有不妥,应以英文原著为准(附后)。本文无意评论这些个意见是否合适,也不想对此议题开展进一步的争论。不过,这段话的确让人感到年轻研究人员活力四射,大胆无畏。一般来说,批评一两个同行,算不了什么,科学争论嘛。但是,要指出整个computer science community 对某某方向 their works have not caught up the current progress 以及 lack serious consideration 可就不是那么简单的了。因为计算机专业同行的研究技艺在于建模计算,业内俗话说 “建模不算,文章一半”。

 

       附图 2011年发表在Physica A》对链路预测问题研究的综述文章[5]

 

平心而论,这篇文章不错,有一定影响力。而且,这段话引起笔者关注,了解到其它专业同行是如何研究同类问题的,会更加广泛地思考一些问题:例如在线社交网络机制研究的模式是否正确?目前开发应用的一些数学模型是否合适?等等。

 

实际上,在对微博和其它复杂信息网络机制研究时,人们往往采取拿来主义,即基于现有图论衍生的网络技术,注重计算技巧,缺乏理论研究。例如,微博是网友在线社交平台,用户间的关系盘根交错,极其复杂。上面提到的一些科技文献,尽管成效显著,但在网络节点间关系和反映这些关系相互作用方面的确没有深刻描述和有效模型,包括数学、物理、生物等领域同仁的研究成果。尤其是在多层次用户关系的微博转发预测时,简单的邻接矩阵定义和在此基础上研发的数学模型,显得十分无力。这一点,多多少少还真让这两位学者言中了。

 

《微博de故事》系列博文介绍巴西利亚大学TransLab团队和其它研究中心从事在线社交网络研究的成果和体会, 特别是粉丝模型的研发,其新颖性和实用性反映了微博研究发展趋势[6] 。下面章节的内容将陆续介绍微博机制研究的挑战以及第一代和第二代粉丝模型以及在微博信息咨询和微博转发预测的应用等等,敬请网友稍候。

 

    注:文献[5] 有关评议的英文原稿,文中文献[21] [22] 参照原文


Link prediction problem is a long-standing challenge in modern information science, and a lot of algorithms based on Markov chains and statistical models have been proposed by computer science community. However, their works have not caught up the current progress of the study of complex networks, especially, they lack serious consideration of the structural characteristics of networks, like the hierarchical organization [21] and community structure [22], which may indeed provide useful information and insights for link prediction. Recently, some physical approaches, such as random walk processes and maximum likelihood methods, have found applications in link prediction. This article will give detailed discussion on these new development[5].

 

 

本节主要参考文献:

 

[1] Y. Sun, J. Han, C.C. Aggarwal and N.V. Chawla. When Will It Happen?: Relationship Prediction in Heterogeneous Information Networks. In Proceedings of Int. Conf. onWeb Search and DataMining,WSDM’12, pp. 663-672, 2012.

[2] Z. Sun, H. Wang, H.Wang, B. Shao and J. Li. Efficient subgraph matching on billion node graphs. Proceedings of the VLDB, Vol. 5, pp. 788-799, 2012.

[3] X. Zhao, A. Sala, C. Wilson, X. Wang, S. Gaito, H. Zheng and B.Y. Zhao. Multi-scale Dynamics in a Massive Online Social Network. In Proceedings of The 12th ACM SIGCOMM Internet Measurement Conference, 2012.

[4] M. Kim, J. Leskovec. Multiplicative Attribute Graph Model of Real World Networks. J. Internet Mathematics. 2012.

[5] Linyuan Lü, Tao Zhou. Link prediction in complex networks: A survey [J]. Physica A: Statistical Mechanics and its Applications, 2011, 390(6): 11501170.

[6] E. Sandes, L. Weigang and A. Melo. Logical model of relationship for

online social networks and performance optimizing of queries. In Proceedings of WISE, LNCS 7651, pp. 726—736, 2012.

 

[21] M. Sales-Pardo, R. Guimer`a, L. A. N. Amaral, Extracting the hierarchical

organization of complex systems, Proc. Natl. Acad. Sci. U.S.A. 104 (2007) 15224.

[22] M. Girvan, M. E. J. Newman, Community structure in social and biological

networks, Proc. Natl. Acad. Sci. U.S.A. 99 (2002) 7821.

 




https://wap.sciencenet.cn/blog-652078-648754.html

上一篇:元旦前夕给女儿开生日Party
下一篇:微博de故事:关系寓意下的邻接矩阵
收藏 IP: 189.72.234.*| 热度|

27 方锦清 刘锋 陆俊茜 曹聪 林涛 武夷山 杨宁 肖重发 刘桂秋 戴德昌 翟自洋 唐常杰 许培扬 边一 陈安 王涛 曾新林 苏晓路 任晓龙 胡明生 杨学祥 傅贵 陆泽橼 曾杰 陈绥阳 biofans yuyuswh

该博文允许注册用户评论 请点击登录 评论 (21 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-24 10:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部