|||
最近给一些杂志审稿,连续遇到回归分析的原理性错误,主要有以下两点:
第一,什么是自变量
这个问题似乎有点可笑,自变量谁都明白。但实际处理过程中,这个问题很多大家都会出错。比如,地区信息化水平是个自变量,用什么衡量?指标很多,诸如万人电脑数量、万人网站数量、百户电视机数量、百人电话数量等等,如果分析地区经济发展的影响因素,假设有资本、劳动力、教育、信息化4个要素,如果资本、劳动力、教育数据是现成的话,那么,我们是否应该构建以下的方程:
经济发展=f(资本,劳动力,教育,万人电脑,万人网站,百户电视,百人电话……)
如果这样构建模型进行回归是错误的,必须将评价信息化的几个指标进行综合,变成唯一结果,然后才能回归,方法可以根据具体情况选择,如主成分、因子、AHP、TOPSIS等等。
指标体系除了评价、决策外,还有一个功能,就是计算中间变量!如本例所示。
本例中,万人电脑数量、万人网站数量、百户电视机数量、百人电话数量等等就不是自变量,而是构成某个自变量或者测度某个自变量的要素。
第二,确定性方程不可以回归
以凯恩斯的宏观经济均衡模型为例:Y= C+I+(X-M),即总产出=总消费+总投资+(出口-进口),那么对于这样的模型,能否用回归分析呢?记住,绝对不可以,回归分析重点分析要素间的相关性,对于确定性方程,是不可以采用回归分析的。
才开始读博士时,和年轻有为的H博士私下聊天,说学校只有1个人(Z教授)懂西方经济学,当时我的第一感觉很吃惊,怎么可能!学校的教授、博导有20个。5年后的今天想想,真是一点都没有错,很多情况下,我们自认为已经搞懂了某个问题,其实未必!当然,这里并不是说某个学术观点,而是有客观标准的某个问题。
2009.11.22 俞立平于邗上
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 11:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社