俞立平博客——邗上居分享 http://blog.sciencenet.cn/u/yuliping 科技评价、技术创新、信息经济 镜像博客:http://www.yuliping.com

博文

榨取数据还是数据挖掘?

已有 3603 次阅读 2012-6-24 11:49 |个人分类:科研心得|系统分类:科研笔记| 数据挖掘, 榨取数据

       在经济学研究中,很多是要进行实证的,近年来基于同一数据采用不同模型进行研究受到一些诟病,质疑的声音主要是有“榨取数据”之嫌,下面谈谈我对这个问题的看法。

        首先,什么样情况下可以评价这个问题?我认为必须是对模型比较熟悉的专家,如果你对模型的原理和用途都不熟悉,就给出YESNO的结果是很难令人信服的。

        模型本身各有所长,一般都有一定的限制条件和用途,在可能的情况下,从不同角度分析确实能够得出不同的结论,这些结论有时候是矛盾的,但更多时候是互相支撑的,所以从这个角度而言,要适当鼓励采用不同的模型来研究同一问题。因为不同的方法放在一起,就能百家争鸣,优点是不言而喻的。

        此外,模型本身的发展和学者的学习有一个过程,有的学者不一定一开始就想采用不同的方法去研究同一问题。比如刚开始学会VAR,可能就会用该模型研究自己领域感兴趣的问题,后面学会VEC,发现也不错啊,可以继续进行深化,再后来学会SVAR,发现又有很多优点,继续用啊,这是一个不断提高的过程。

        那么问题出在什么地方呢?主要是一些初学者在对经济理论把握不好的情况下,没有很好地去补课,而是迫不及待地借用一些模型写论文,这样的论文不要看模型就知道问题出在什么地方,看模型后也许问题更大。基本理论知识不够,所以才产生了“榨取数据”问题。这确实是需要改进的,也是目前研究生容易犯的一些错误。当然,站在研究生的角度,面临巨大的生存压力,潜心做学问确实是很不容易的事情,我们的社会太功利了,让学生不功利是不可能的,除非大学首先不功利,可是哪个大学对老师不是一套复杂的“压榨”体系?这个问题大了,呵呵。

        再说说数据挖掘,本质上,数据挖掘恰恰是“榨取数据”。数据挖据技术广泛应用在自然科学与社会科学中,做出了杰出的贡献。对数据挖掘应用稍有了解的学者,一定会感叹数学的美妙,确实能够发现数据背后的许多东东。遗憾的是,数据挖掘技术在经济学中应用极少,这是个奇怪的问题?可能经济学的研究范式已经深入人心,比如理论假设、数据、检验等等,这其实禁锢了数据挖掘技术在经济学中的应用,是需要改进的。我这几年就在有意识地做这件事。

        任何学科都有自己的理论,在掌握好基本理论后,榨取数据其实是可以适当鼓励的,科学是美的,能够发现美是一件快乐的事情。

 

                                      2012.6.24 俞立平 于宁波

 

   



https://wap.sciencenet.cn/blog-45134-585314.html

上一篇:写论文与说相声
下一篇:姜堰顾高东俞的宋井小考
收藏 IP: 122.246.191.*| 热度|

6 曹聪 王芳 刘桂锋 陈筝 武夷山 魏瑞斌

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-22 09:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部