|
贝叶斯定理:清晰思考与决策的科学工具,汤姆·奇弗斯著,韩潇潇译,中信出版集团2025
我一直不喜欢概率论,因为概率论没有因果性,虽然概率论一直宣称是有因果性,在所有的概率理论,贝叶斯宣称是有很强的因果性的,其标签是“由果推因”的一种概率论,因而找了这本书来读,确实有一段谈贝叶斯的因果性,但谈的不透彻,我还是没接受,慢慢进步吧。
在我的认知中,概率论就是在对未知世界中无知的东西而采用的的不得已的办法,比如面对数量庞大的对象(最为常见的是分子),只能通过“平均”的方法来描述他们,而通过对不同性能和参数的选择得到不同的“平均”结果(比如高斯分布)。同样的,在对未发生的未知领域还可以通过这种方法来预测结果,比如常见的掷硬币实验,但其验证过程,同样是需要庞大数量的堆积而得到结果。也就是说概率论只是“世界不为人知的那一面的一种描述方式”。换句话说,概率是一种主观的东西,是人类对未知领域、对真理的最佳推测的一种表述,它不是这个世界的天然属性而是我们对世界的一种理解(这一“换句话说”,就有些高大尚的形而上了)。
通过本书,我才知道前面所说的这种概论论叫“频率学派”,也就是“根据已知事实推测某些结果的概率”,而“贝叶斯学派”是“根据观测到的结果推测真实世界是某种可能性的概率”(这种可能性可以是因也可以是果)。前者是“概率推断”,即根据对整体的认知情况推测个别事件的概率,后者是“统计推断”,即根据抽样调查的结果推测整体的情况。定义很清楚,但对我来说理解起来还是有些困难,特别是在具体问题中分清哪个是用了频率学派的方法,而哪个是用了贝叶斯学派的观点总是不太清楚。这种结果也正常,总不能靠一本普及类读物就掌握一门学问,何况还是一部谈决策学的贝叶定理的书。
这书分共五章可为两部分,第一部分是介绍贝叶斯概率论的主要观点及发展过程(前两章),第二部分是介绍决策过程中都在什么方面体现出了贝叶斯原理(后三章)。
贝叶斯原理的基本思想就是有先验论,在解析问题前,先有一个对问题的预设立场,而后通过后来的知识不断修改已得到的后验结果。按照书中的说法:贝叶斯理论自治、连贯,体系内没有任何矛盾之处,而频率学派经常会出现解释不通的情况。
贝叶斯决策论有很多有意思的特征,其中之一就是很难用新证据去加强自己的理论,因为在预期当中,找到的任何一份证据都会有可能地增强、减弱自己的理论;但若没找到新证据,一定会减弱自己的理论。对某个证据的把握越大,发现它的时候就越不惊讶(后验概率的变化程度越小),但若没发现新证据就会越惊讶(后验概率变化程度越大)。比如不相信世界上存在独角兽,那没看到独角兽的每一秒钟,都能成为“世界上不存在独角兽”这个理论的一小份证据,都能增强心(但增强的不多)。但若真的看到了一只活生生的独角兽,那这份证据就会对产生毁灭性的打击,后验概率会大幅下降(这里还包含了“没有证据本身也是一种证据”的道理)。
贝叶斯定理的先验概率本质上是一个哲学问题:判断具有主观性,“先验”描述的并不是世界本身,而是我们自身的已知或无知。
这种理论的直接结论就可以是“龙生龙凤生凤,老鼠的儿子会打洞”这种血统论,估计这也是在近几十年这种理论被打压的伦理原因,虽然书中并没有明示。(但话说马有种马牛有牛狗有种狗,强调血统纯正,那为什么到了人就没有血统论了呢,只是因为道德与伦理的原因吗,从生物技术上讲是个什么样的?),几十年来,贝叶斯学派的方法论几乎像民间偏方一样传下来,只是在近些年因为在大数据模型中这种方法得到广泛应用而逐渐引起人们的重视并被接受(书中讲其实在图灵二战中破译密码建立信息论的时候就采用了这种方法)。
书中给出了频率学派在学术期刊中的应用,比如引用率之类的考核(实在话,我在其中没有分辨出频率学派和贝叶斯学派对学术论文发表的影响,但靠概率论的统计方法是不对的这个结论是接受的)学术期刊鼓励科学家们去讲好的故事,而不是做好的科学。而且期刊还用影响因子这一指标去鞭策作者撰写阅读量高、言简意赅、浅显易懂的文章。然而这并不符合科学文献的初心:文献应当完整且翔实。显然,只靠贝叶斯方法无法解决科学界的所有问题。如果学术期刊仍然青睐结论新奇有趣的论文,如果研究人员仍然面临“不发文毋宁死”的困境,如果论文数量仍旧是职业晋升的硬性标准,那整个激励模式就仍然没有处于正轨之上。
书中谈及一些心理学人物时,并不是用了褒义的态度,而是引用了2011年的一次心理实验数据做假的事情来批评,包括达里尔・贝姆、丹·艾瑞里和丹尼尔·卡尼曼,认为他们很多研究都遭到了质疑。
全书认为在决策过程中都表现出了或者体现了或者暗含了贝叶斯原理,但并没有给出在决策过程中如何做出正确选择的方法。在面临任何一个实际问题时,将问题转化成贝叶斯问题,就会是一个巨大的挑战,也就如何正确的建模。书中所提及的那个著名的“三门”定理,表面看上去一个极其简单的问题而要经过数篇讨论才搞清楚其背后所隐藏的概率模型,而建立模型后还仅是一个几率大小的问题,并不会给你带来确切的答案。就像说吸烟(还有很多诸如吸烟年限和吸烟量等因素)得肺癌的比例高于不吸烟得肺癌的三倍(记忆中的数据,并不一定准确),但对于每一个具体的人来讲,你可能吸烟而不得肺癌而也可能不吸烟而得肺癌,其中并无确凿的因果关系。
书写的太啰嗦,比如在那著名的叶贝斯小球实验中,是用“小球”还是“台球”还啰嗦两句,估计删减百分十的内容完全不影响阅读,而删减百分之二十的内容完全不影响理解。
有一个前言,其作者的名头是“创业实践导师”,按照贝叶斯的理论,我的先验理论告诉我“这种名头的人不学无术的几率比较高”,我就不读了。或许这是位学者或许贝叶斯理论错了,这便是我的直接应用。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-9-6 02:49
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社