twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

一般意义上的统计学原理很难产生新的知识 精选

已有 5146 次阅读 2024-2-14 08:42 |个人分类:2024|系统分类:科研笔记

一般而言,统计学的主要目标是通过分析和解释数据来揭示数据背后的模式、规律或趋势,而不是直接产生全新的知识。统计学通常依赖于已有的数据集和已知的假设条件,在这些基础上进行推断和预测。因此,一般的统计学原理并不能直接创造全新的知识,而是在已有知识的基础上对数据进行解释和推断。

关于新知识与统计中的“野点”之间的联系,可能存在一种误解或混淆。在统计学中,“野点”通常指的是数据集中的异常值或离群点,它们与数据集中的大多数值明显不同。这些异常值可能会对统计分析和模型的准确性产生影响,需要被识别并相应地处理。但将“野点”与新知识直接联系起来并不准确。

虽然统计学本身不能直接创造全新的知识,但在科学研究和决策制定中,统计方法可以帮助从数据中发现新的见解、关联或模式。通过对数据进行深入的分析和统计推断,人们可以得出对现象的新认识或理解,从而推动知识的进步和创新。因此,统计学在揭示隐藏在数据背后的信息和规律方面仍然具有重要的作用,尽管它本身并非直接创造新知识的工具。

例如,假设我们想研究某种新药物对心血管疾病的疗效,我们可以进行一项临床试验来测试该药物是否能够降低患者的血压。在试验中,我们选取一组患有高血压的患者,将其随机分为两组,一组服用药物,另一组服用安慰剂,并记录每个人的血压值。

对于这个实验,统计学提供了诸如均值、方差、显著性检验等工具,帮助我们判断药物是否确实对患者的血压有显著影响。但是,通过这些统计原理我们无法直接产生新知识,比如说我们无法确定药物如何作用于人体内部、它是如何改变血压的等等。这些问题需要我们进行更深入的研究和探索,例如进行生物学和医学方面的实验,以便更好地理解药物的作用机理。

因此,一般的统计学原理在解释和推断现有数据方面具有重要意义,但在产生全新知识方面并不足够。要回答更深层次的问题,需要更多的研究和实验。

产生统计中的“野点”所引发的新知识通常是通过对异常值或离群点进行深入分析和解释得出的。这种新知识的产生可以基于以下几个步骤:首先,需要使用合适的统计方法或技术来检测数据集中的异常值。常见的方法包括箱线图、Z-分数、Tukey's fences等。这些方法可以帮助识别那些与数据集中的大多数观测值明显不同的数据点。其次,一旦异常值被检测到,就可以进一步探索它们的特征。这可能涉及到比较异常值与正常观测值之间的差异、查看异常值的上下文信息以及对异常值进行描述性统计分析。然后,在探索异常值的特征基础上,可以尝试解释异常值的出现原因。这可能包括考虑数据收集过程中的错误、测量误差、采样偏差或其他未知因素。通过仔细研究异常值,可以寻找其背后的潜在原因或机制。最后,通过解释异常值,我们可以获得关于数据集或研究对象的新见解。这些新见解可能包括发现新的关联或模式、理解异常事件的原因或提出新的假设。这些新知识能够推动研究的进展,并为进一步的探索和实验提供指导。

实际上,产生统计中的“野点”所引发的新知识通常需要在更广泛的背景知识和领域专业知识的支持下进行解释和理解。统计学只是一个工具和方法,它提供了对数据的分析和推断,但对于产生真正的新知识,还需要结合其他领域的知识和专业判断。

譬如,假设我们正在研究一个城市的平均降雨量,并且已经收集了每天的降雨数据。我们将这些数据用于计算每个月的平均降雨量。在分析数据时,我们发现某个月的平均降雨量明显高于其他月份,出现了一个异常值。

1、检测异常值

我们使用箱线图或者Z-分数等方法来检测异常值。通过分析数据,发现有一个月份的平均降雨量远远超过其他月份的值,被认定为一个异常值。

2、探索异常值的特征

针对这个异常值,我们进一步探索其特征。例如,我们可以查看该月份的具体降雨情况,比较它与其他月份的降雨模式是否存在明显不同之处。

3、解释异常值

通过进一步分析,我们可能发现这个异常值出现的原因是由于一个剧烈的天气事件,比如一次罕见的暴雨或台风。这个异常值并不代表正常的降雨模式,而是由于特殊事件引起的。

4、发现新知识

通过解释异常值,我们可以得出结论:该城市的降雨模式并没有发生显著变化,只是受到特殊事件的干扰。这一发现可以帮助我们更好地理解该城市的降雨情况,并为未来的天气预测和城市规划提供有价值的信息。

在这个例子中,通过分析异常值,我们发现了一个特殊事件对数据产生了影响,产生了新的知识。这个发现能够帮助我们更好地理解数据背后的真实情况,并为进一步的研究和决策提供指导。





https://wap.sciencenet.cn/blog-40841-1421598.html

上一篇:适应力和应变力是智能系统的重要组成部分
下一篇:“然后呢”与“应该”
收藏 IP: 117.136.89.*| 热度|

12 张学文 周忠浩 王安良 崔锦华 郑永军 檀成龙 葛素红 农绍庄 梁洪泽 黄河宁 刘全慧 PengPeter

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 20:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部