止于至善--胡业生分享 http://blog.sciencenet.cn/u/胡业生 唤醒人的悟性,开启人的智慧,提升人的思维能力,

博文

大数据可靠性

已有 3782 次阅读 2015-8-12 08:21 |个人分类:科学精神|系统分类:观点评述

  昨日,置顶的周涛教授博文,通过学生物理痕迹和学生优劣等级之间相关性分析研判,得出好学生的成长轨迹。这个结论似乎没有证据证明存在问题。问题来了,同样进图书馆,阅读内容相同,作息、投入、悟性不同,这些变量数据如何量化呢?如何取权重呢?一句话,变量的选取科学性怎么保障?这里面隐含一个前提,就是相同投入对等回报。这个前提是有问题的。大数据把假设为没有任何差异的主体,忽视心理、智商、环境等因素在因果中的作用,可能把一个复杂问题简单化了。大数据只能研判一种现象可能出现的原因和趋势,这种依据可靠性是  不确定的。所以,大数据时代可能很多用于模糊评价,不适合以科学名义标签化。

 求真,是一种科学精神,当你的手段是一种不完全归纳时,保留一种对局限性的认知,是理性的、科学的。大数据对变量选取是经验性的主观的,前提的可靠性也是要商榷的。大数据可以客观发现行为的习惯,能不能倒退出成功与习惯之间的关系需要再思考。



https://wap.sciencenet.cn/blog-40486-912413.html

上一篇:老要随时 少要乖
下一篇:优质资源配置是最大的公平问题
收藏 IP: 60.170.29.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-23 20:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部