求真分享 http://blog.sciencenet.cn/u/zlyang 求真务实

博文

[严肃内容] 鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示

已有 4954 次阅读 2020-7-20 12:11 |个人分类:风电功率预测|系统分类:科研笔记| 鲁索, Rousseau, Pearson, product-moment, correlation

[严肃内容] 鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示

  

一、鲁索(Rousseau)教授简介

   比利时情报学家、国际科学计量学与信息计量学学会前会长罗纳尔德·鲁索(Ronald Rousseau)教授,国际著名信息计量学专家,被誉为信息计量学之父。

   1979年获比利时科学院奖,2001年获国际科学计量学领域最高奖普赖斯(Price)奖。

Ronald Rousseau in Beijing 2012   Liu_Yuxian_with_doctoral_degree_2012.jpg

鲁索和刘玉仙博士,2012,北京

http://users.telenet.be/ronald.rousseau/html/more_pictures1.html

            

   鲁索教授是本网刘玉仙博士、研究员的博士导师。刘玉仙博主是信息科学类杰出博士研究奖(The 2011 Emerald/EFMD Outstanding Doctoral Research Award in the Information Science category)得主。

                       

二、鲁索(Rousseau)与皮尔逊相关系数(Pearson product-moment correlation coefficient)的实质

   Ronald Rousseau 等人在2003年发现:“Pearson’s r is probably not an

optimal choice of a similarity measure in ACA”,这里的 Author cocitation analysis (ACA) 是“作者共引分析”。

   “皮尔逊相关系数可能不是定量计算‘作者共引分析’相关性的好指标”,真是吓死人了!

         

   皮尔逊相关系数的定义是:

皮尔逊相关系数变量 2020-07-19_副本.jpg

皮尔逊相关系数公式 2020-07-19.jpg

由于 rXY 计算时减去了“均值”,该系数反映的是两个随机变量  Y  之间波动性之间的“相关性”,而不是“均值”之间的相关性

        

   下面用几幅图片直观示意一下皮尔逊相关系数的意义。

   不难发现,对于两个“均值”不为 0 的时间序列  

相关系数-鲁索 Rousseau 图 01.jpg

皮尔逊相关系数反映的是其中波动成分之间的“相关性”,即下图:

相关系数-鲁索 Rousseau 图 02 波动.jpg

而不是其“稳定成分/均值”(虚点线)之间的相关性!请参见下图:

相关系数-鲁索 Rousseau 图 03 直流.jpg

  

   所以,分析作者们之间的“共引”情况时,皮尔逊相关系数反映的是“作者们之间共引变化”之间的“相关性”,而不是真正的“共引/稳定成分/均值”之间相关性的强度

                      

三、鲁索(Rousseau)教授该发现的价值预估

   罗纳德·鲁索(Ronald Rousseau)等人2003年的这个发现,真是吓死人了!俺可不敢说出该发现的广泛影响。它绝对是人类21世纪的“重要”科技发现之一。傻以为:在22世纪,鲁索的这个发现应该被评为“人类 21 世纪一百项重要科技成就”之一!

   (1)如果认为【牛顿力学】是“第 1 流”是,【麦克斯韦电磁场方程】是“第 1.3 流”的,

   (2)那么,Ronald Rousseau 等人2003年可能首创并将引发一个“第 4.5 流”上下的重大科技发现。

    也许是比“激光和光纤 Laser and Fiber Optics”更重大的发现(发明);很有可能在“高速公路 Highways”水平上下。

  

陈希孺:国际著名数理统计学家.jpg

   不禁又怀念起我国的数理统计学家、中国科学院院士陈希孺教授(1934-02-11 ~ 2005-08-08)。http://casad.cas.cn/sourcedb_ad_cas/zw2/ysxx/ygysmd/200906/t20090624_1810233.html

131333o05vi0ev0hbzspzu.jpg

   最有可能的前途或许是:数据分析不大可能发展成一门符合现今数学分支严格性标准的那种“硬”科学分支,而会以一个其领域没有明确界定的实体而存在,……

上面截图和引用的文字,请看:陈希孺院士,1998,《数理统计学简史》第276页。

                          

四、什么是“相关性”?怎样量化度量“相关性”?都是目前未解难题

   就是阿Q,一时也没有办法。

   俺找了又找,还没有找到“科学”地计算“相关性”的单一量化指标。

                 

五、俺能提出定量计算“相关性”的新指标吗?

   就是阿Q“眼里的阿Q”(简写为“QQ”,不是网站qq),一时也不敢夸下海口。

          

参考资料:

[1] 武夷山,2015-01-23,“大概近似正确”的评价 精选

http://blog.sciencenet.cn/blog-1557-861961.html

[2] Per Ahlgren, Bo Jarneving, Ronald Rousseau. Requirements for a co-citation similarity measure, with special reference to Pearson's correlation coefficient, Journal of the Association for Information Science & Technology, 54(6): 550–560, 2003.

http://onlinelibrary.wiley.com/doi/10.1002/asi.10242/abstract

[3] 罗纳德·鲁索_百度百科

https://baike.baidu.com/item/%E7%BD%97%E7%BA%B3%E5%BE%B7%C2%B7%E9%B2%81%E7%B4%A2

[4] Ronald Rousseau: Homepage

http://users.telenet.be/ronald.rousseau/html/more_pictures1.html

[5] Derek de Solla Price Memorial Medal

http://www.issi-society.org/awards/derek-de-solla-price-memorial-medal/

2001 - Ronald Rousseau (Belgium) - Leo Egghe (Belgium)

[6] 美国国家工程院. Greatest Engineering Achievements of the Twentieth Century [EB/OL]. 

http://www.greatachievements.org/

[7] 中国科学院,院士,陈希孺

http://casad.cas.cn/sourcedb_ad_cas/zw2/ysxx/ygysmd/200906/t20090624_1810233.html

相关链接:

[1] 2020-7-14,破除论文“SCI至上”:给定量化科技评价研究的一些建议

http://blog.sciencenet.cn/blog-107667-1242010.html

[2] 2020-06-17,敬请慎重使用和看待“数据统计与分析”的结果

http://blog.sciencenet.cn/blog-107667-1238236.html

[3] 2020-06-07,[求证] 二十世纪最伟大的工程成就:关键时间与起因

http://blog.sciencenet.cn/blog-107667-1236835.html

             

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!



https://wap.sciencenet.cn/blog-107667-1242781.html

上一篇:[随感] 未来的人类教育模式
下一篇:[讨论] 住监狱是否能做出更好的科技成果?
收藏 IP: 202.113.11.*| 热度|

12 刘玉仙 李毅伟 杨学祥 郑永军 范振英 朱晓刚 许培扬 曾杰 武夷山 宁利中 胡文兵 李宏翰

该博文允许注册用户评论 请点击登录 评论 (51 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 01:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部