|||
小议科学统计
黄安年文 黄安年的博客/2011年2月17日发布
我们的社会经济和文化生活是离不开数字统计的,科学的数字统计反映了社会经济和文化生活的真实,不科学的甚至捏造的数字统计则扭曲了社会历史的真实,大到关系国家政治的重大历史事件,小到时下普遍学术单位施行的学术成果评估的量化机制,统计数字不科学会害死人,吃大亏。上世纪50年代大跃进虚报、瞒报数字,整个社会陷入数字造假的运动中,结果在三年困难时期死了数以百千万计老百姓,迄今究竟死了多少人依然没有一个权威部门提供一个可以让人信赖的数字。1958年大跃进时正是日本跃居全球第三、西方国家第二的位置,我们的统计预测会很快赶英超美,结果花了整整半个世纪以上的时间,才到2010年在GDP经济总量上微超日本。
中国现在究竟有多少穷人,这穷人的标准是什么,联合国有联合国的标准,世界银行有世界银行的标准,欧洲联盟有欧洲联盟的标准,中国在不同时期又有不同的标准,这些标准的确定依据不同,自然结果就不同。这还涉及贫困线和最低贫困标准的划定,而这项标准的划定关系我们的社会保障机制,关系最低社会保障线的确定。否则划高、划低都会出现问题。我们现在通常说贫富悬殊,甚至两极分化,这要有数据证明,世界银行显示中国家庭收入分配的比例数字但是并没有逐年公布的确切统计数字,例如最低家庭收入的5%或10%、20%和最高家庭收入的80%、90%或95%分别在100%家庭中所占有的比例。至于这家庭收入是由那些项目组成也十分的关键,涉及统计家庭收入是否科学。目前城乡人口的比例各占多少,这涉及如何确定城镇人口和农村人口,在不同时期的城镇人口不同的确定会导致不同的人口比例出现。人口的计算同样是个问题,户口登记的常住人口、外来人口,那么没有户口的人口(黑户)怎么统计,移居国外的人口(含常主和改变国籍)又怎么统计,都有一个科学统计问题,尤其是在各个地区计算人均GDP时出现各地相加之和和全国统计对不上号,是由于一些城市在统计本地GDP总量时计算了外来人口的贡献,而计算人均GDP时却略去了外来人口。以上列举的例子说明数字统计不科学,依据不统一,结果大不相同。
昨天国家统计局公布CPI数据显示,1月份全国居民消费价格指数(CPI)为104.9,比去年同月上涨4.9%,低于市场预期,这是CPI权数调整后首次公布的数字,CPI权数构成的调整影响价格总指数的方向和力度,它既取决于权数构成的调整力度,也受到分类价格指数高低的影响。这种调整在2001年确定后2005年作过调整,现在是第二次。今后还需要进行调整。由于这次调整正值人们对于通货膨胀的很高预期,因而有人指责人为压底CPI,其实是一种误解,因为只要构成基本反映实际而且以后五年以此标准进行统计不存在是否影响人们消费心理问题。
在学术界,学术成果的界定不同于经济数字的统计,学术成果单纯用数量统计来认定是很不科学的,关于这个问题请见《再谈学术不端保护伞和学术量化机制》,黄安年文黄安年的博客/2011年2月16日发布http://bbs.sciencenet.cn/home.php?mod=space&uid=415&do=blog&id=413404)
科学统计是国家政府机构的职责,对于科学网的博主而言,笔者以为注意数量的科学使用是重要的,有一说一,有二说二,既不夸大也不缩小,不将个案、局部说成整体,实事求是地科学分析,避免情绪化的评论。至于系统生机后新旧两个版本的访问量由于统计依据不同出现了衔接后的矛盾现象,依然是需要解决的问题。例如依据我的博客访问量统计1月22日22时旧版访问量合计:6605537,而新版1月23日8:07仅仅是6570077,2月13日12:19才是6605442。2月17日报:30撰文是6627816可见这种衔接相加的统计方式存在的问题是显而易见的。
以下是2007-2010年间笔者有关部门科学统计问题的博文。
*高度重视统计数字的科学检验 ,黄安年的博客, 2007年3月12日(http://www.sciencenet.cn/m/user_content.aspx?id=522)
*北大校友中已有院士586名的统计有无水分?黄安年的博客,2007年7月22日(http://www.sciencenet.cn/m/user_content.aspx?id=4784)
*避免重复统计现象 ,黄安年的博客,2007年8月5日(http://www.sciencenet.cn/m/user_content.aspx?id=5521)
*科学发展观和科学统计数据,黄安年的博客,2007年9月11日(http://www.sciencenet.cn/m/user_content.aspx?id=7174)
*科学结论要求严谨,真理越过雷池就成谬误,黄安年的博客,2007年10月3日(http://www.sciencenet.cn/m/user_content.aspx?id=8281)
*“99%以上”和“98%以上”的统计数字是怎么出来的?黄安年的博客,2007年10月6日(http://www.sciencenet.cn/m/user_content.aspx?id=8416)
*看不懂的2008阅读率 ,黄安年的博客,2009年5月4日(http://www.sciencenet.cn/m/user_content.aspx?id=229753)
*提供统计对比数字要全面,黄安年的博客,2009年7月1日(http://www.sciencenet.cn/m/user_content.aspx?id=241249)
*单篇博文点击量排行比博文平均点击量排行更有意义,黄安年的博客/2010年7月18日发布
(http://www.sciencenet.cn/m/user_content.aspx?id=345056)
*统计数字的缺失:排他性,黄安年的博客,2010年8月1日发布(http://www.sciencenet.cn/m/user_content.aspx?id=349124)
*统计数字说明啥问题,黄安年的博客,2010年10月3日发布
(http://www.sciencenet.cn/m/user_content.aspx?id=369455)
*科学网博客升级改版后的访问量统计有待订正,黄安年的博客/2011年1月18日发布
http://bbs.sciencenet.cn/home.php?mod=space&uid=45&do=blog&id=406259
*再谈科学网博客新版访问量统计问题,黄安年的博客/2011年1月25日发布
http://bbs.sciencenet.cn/home.php?mod=space&uid=415&do=blog&id=407730
*再谈博文平均点击量的统计标准,黄安年的博客/2011年1月31日发布
http://bbs.sciencenet.cn/home.php?mod=space&uid=415&do=blog&id=409301
*不同依据的统计访问量累计发布是否科学?黄安年的博客,2011年1月31日发布
http://bbs.sciencenet.cn/home.php?mod=space&uid=415&do=blog&id=409311
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-6-11 08:42
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社