俞立平博客——邗上居分享 http://blog.sciencenet.cn/u/yuliping 科技评价、技术创新、信息经济 镜像博客:http://www.yuliping.com

博文

关于回归的两个易犯错误

已有 4144 次阅读 2009-11-22 15:15 |个人分类:科研心得|系统分类:科研笔记| 错误, 回归

 

       最近给一些杂志审稿,连续遇到回归分析的原理性错误,主要有以下两点:

    第一,什么是自变量

这个问题似乎有点可笑,自变量谁都明白。但实际处理过程中,这个问题很多大家都会出错。比如,地区信息化水平是个自变量,用什么衡量?指标很多,诸如万人电脑数量、万人网站数量、百户电视机数量、百人电话数量等等,如果分析地区经济发展的影响因素,假设有资本、劳动力、教育、信息化4个要素,如果资本、劳动力、教育数据是现成的话,那么,我们是否应该构建以下的方程:

经济发展=f(资本,劳动力,教育,万人电脑,万人网站,百户电视,百人电话……)

如果这样构建模型进行回归是错误的,必须将评价信息化的几个指标进行综合,变成唯一结果,然后才能回归,方法可以根据具体情况选择,如主成分、因子、AHPTOPSIS等等。

指标体系除了评价、决策外,还有一个功能,就是计算中间变量!如本例所示。

本例中,万人电脑数量、万人网站数量、百户电视机数量、百人电话数量等等就不是自变量,而是构成某个自变量或者测度某个自变量的要素。

第二,确定性方程不可以回归

以凯恩斯的宏观经济均衡模型为例:Y= C+I+X-M),即总产出=总消费+总投资+(出口-进口),那么对于这样的模型,能否用回归分析呢?记住,绝对不可以,回归分析重点分析要素间的相关性,对于确定性方程,是不可以采用回归分析的。

才开始读博士时,和年轻有为的H博士私下聊天,说学校只有1个人(Z教授)懂西方经济学,当时我的第一感觉很吃惊,怎么可能!学校的教授、博导有20个。5年后的今天想想,真是一点都没有错,很多情况下,我们自认为已经搞懂了某个问题,其实未必!当然,这里并不是说某个学术观点,而是有客观标准的某个问题。

                         2009.11.22 俞立平于邗上



https://wap.sciencenet.cn/blog-45134-272976.html

上一篇:我对自己论文署名的几点想法
下一篇:故地重游
收藏 IP: .*| 热度|

3 武夷山 郭战胜 王德华

发表评论 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-26 20:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部