草中笋分享 http://blog.sciencenet.cn/u/jiangjiping

博文

统计数据的解读需要科学的分析才准确

已有 3206 次阅读 2015-3-12 02:09 |个人分类:观点交流|系统分类:观点评述| 癌症, 雾霾, 柴静, 统计数字

统计数据的解读需要科学的分析才准确

蒋继平

2015311

 

最近因为柴静的[穹顶之下]引发的风波,社会上对柴静在报告中引用的一些统计数字出现了明显不同的解读。今天的科学网的一篇由岳东晓发表的[方舟子妄批柴静捏造数据的错误]和许培杨博主的[科学网精选博文遭方舟子驳斥]两篇文章就是这种对同一个统计数字做出不同解读的典型例子。

我对这两个文章不进行任何个人的评论。 我想说的是, 对一个统计数字, 首先要知道统计数字的来源,统计方法, 和这个统计数字涉及的相关因素。然后根据这些信息用科学的头脑进行分析和解读。 只有这样, 才能得到比较正确的结论。

我记得在讨论有关雾霾是否与患癌症有关的一篇博文中, 有人引用联合国卫生组织发表的世界各国癌症发病率的统计数字来说明癌症好像与雾霾没有任何关系。他的理由是:根据联合国卫生组织2012年的统计数据, 世界上癌症发病率排在前五名的五个国家是:丹麦、法国、澳大利亚、比利时和挪威而这五个国家的空气很好, 生态环境也不错。

从表面上看起来, 这个统计数字和社会现实似乎很容易得出空气污染与癌症没有任何正相关的结论。 但是, 事实上这样的结论是比较草率的, 是没有经过科学分析造成的。

为什么这么说呢, 我的理由如下。

首先, 我们要知道癌症是一种慢性病, 从接触到有害物质, 到真正的发病需要相当长的时间, 通常可能需要10-20年的时间。 所以, 2012年的癌症统计数字, 实际上反映的可能是几十年前的生态环境情况, 而不是现在的生态环境情况。

其次, 生物生病涉及到三个主要因素, 一是寄主的抗病能力, 二是致病物的致病能力, 三是环境条件对寄主和致病物的影响力。 癌症是一种非常特殊复杂的病,这种病可能由多种致病物引发, 而不是仅仅由空气污染引发。 空气污染引发的可能是与呼吸道有关的癌症, 比如说, 肺癌, 鼻咽癌和气管癌等。 而这个统计数据包含所有类型的癌症。其他类型的癌症是由其他致病物引发的。 要是一个生态环境中其他致癌物的比例很高, 那么, 生活在这个生态环境中的人必然会具有较高的患癌症的机率。 虽然, 这个区域看起来蓝天白云,没有雾霾,但是, 这样的环境仍然不能排除其他癌症的发生呀。具体地来说, 要是用核电站发电的比例很高, 那么, 需要考虑到放射性污染引发的癌症。 还有, 实验室经常使用放射性物质的科研人员,患癌症的概率可能要高一些。这几个国家的科研水平较高, 是不是也是一个因素。

再来说国家和人群基因的关系。 总的来说, 一个国家的人群的基因比较相近。 而人群的基因对癌症发生的影响最大。 因为我一辈子的主要工作就是使植物生病(罪业呀),所以, 我深深懂得生物是否生病的关键因素是生物本身对某种致病物的抵抗力。 这种抵抗力是内因, 病原菌和环境条件是外因, 外因必须通过内因而起作用。 这就是为什么在同样的环境条件下用同一个致病物接种,有的品种生病, 而其他的还能健康生长的道理。 我怀疑是否排在前五位的国家的人群对某些致癌物特别敏感, 容易得癌症。

然后再来分析环境条件和致病物对生物生病的影响。 这点好像不用多说, 读者们自己也可体悟到其中的道理。 要是没有致病物, 生物就不会生病, 这是很明显的。但是, 癌症是一个很特殊的病, 它可由许多因素引发, 而且是慢性累积效应。 雾霾只是大气环境的一个表面现象, 它的组分在不同的时期和不同的地点可能很不一样。 比如说,烧煤碳产生的雾霾和烧塑料产生的气体的组分是不一样的, 前者产生黑色的烟雾,看上去是真正的雾霾, 而后者产生的是淡淡的无色气体。 但是, 后者可能更能引发人们的癌症。据联合国世界卫生组织的报告, 丹麦和挪威每年燃烧的塑料也是在世界上排在前面的两个国家。因而,我怀疑这两个国家的高癌症发病率是否与烧塑料有关。要是那样的话,那么,癌症与空气污染具有明显的正相关就是不争的事实。这里特别需要说明的是,空气污染不能用简单的可见度来衡量,而是需要对空气组分进行检测分析。

还有,统计数字来自于群体样本记录的收集。这个群体样本记录涉及到一些因素。先进的国家对这样的记录做得比较好,先进的国家对个体的健康保护也做得比较好,他们技术先进,检测准确。这是发现癌症的一个优势。因而,先进国家的统计数字可能真实地反映了人群中的发病率,而落后国家的统计数字可能不能准确地反映实际患病的人数。 

最后,我要说的是,一个统计数字,只是一个社会或者自然现象的客观记录,这个数字仅是一个表面现象,它必然产生于其他因素。所以,在解读这个统计数字时,我们必须对产生这个数据的因素进行认真的分析,只有知道了这些因素的原委后,我们才能真切地领悟到这个数字包含的内容和代表的意义。借此机会,我提请大家思考这样几个问题,不管柴静制作[穹顶之下] 的动机和目的是什么,不管她采用的表达是否合适,不管她应用的数据图表是否真实,您认为严重的雾霾对健康是有益呢,还是有害呢?您是喜欢生活在蓝天白云下,还是在灰暗的雾霾中呢?在您有了答案后,您应该采取哪种行动呢?




https://wap.sciencenet.cn/blog-203132-873823.html

上一篇:于艳茹事件充分暴露了中国科教界的若干问题
下一篇:​我对具有中国特色的现代化农业发展的构想(1)
收藏 IP: 74.118.233.*| 热度|

4 戴德昌 白龙亮 yunmu chenhuansheng

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 13:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部