博文

自由能第二章主动推断——生命如何成为世界的主人

已有 295 次阅读 2026-4-12 11:42 |个人分类:我思故我在|系统分类:观点评述

第二章：主动推断——生命如何成为世界的主人

2.1 从反应到预测：认知的革命

想象一只单细胞生物，比如草履虫，在显微镜下的水滴中游动。它的世界是简单的：化学梯度、温度变化、光线的明暗。当环境变得不利——比如盐分过高——它会收缩，改变游动方向，寻找更适宜的区域。

这看起来只是简单的"刺激-反应"：环境变化→生物反应。但如果我们仔细观察，会发现一些微妙之处。草履虫并不是在感受到不适之后才随机尝试方向，它的运动模式似乎带有某种"目的性"——它倾向于游向之前发现过营养的区域，避开曾经遭遇过危险的地方。

这种"目的性"长期以来被排除在严肃科学讨论之外。十九世纪的生物学家可能会用"向性"（tropism）来描述这种现象——植物向光、根部向水——但向性被认为只是物理化学反应的机械结果，不涉及任何"认知"或"意图"。生命被看作复杂的机器，输入决定输出，没有中间环节。

但这种观点在二十世纪后半叶开始瓦解。认知科学的兴起，特别是控制论和人工智能的早期发展，让人们意识到：即使是简单的生物，也在进行某种形式的"信息处理"。它们不仅仅是被动地响应环境，而是在"表征"环境——它们的内部状态以某种方式对应着外部世界的特征，这种对应使得它们能够"预期"未来并据此行动。

这就是"认知"的核心：不是拥有复杂的神经系统，而是拥有关于世界的"模型"——无论这个模型多么简单——并能够用这个模型来指导行为。从这个角度看，草履虫在化学梯度中的游动，细菌在营养浓度中的趋化运动，甚至病毒在宿主细胞表面的识别，都是某种形式的"认知"——它们都在基于内部结构对外部世界进行"推断"。

2.2 贝叶斯大脑：不确定性的驯服者

要理解这种"推断"的本质，我们需要引入一个十八世纪牧师的发明——贝叶斯定理。

托马斯·贝叶斯（Thomas Bayes）是一位英国长老会牧师，他在1763年发表的论文中提出了一种计算"逆概率"的方法。传统概率回答的问题是："已知硬币是公平的，抛出正面的概率是多少？"而贝叶斯关心的是逆问题："已知抛出了十次正面，硬币是公平的概率是多少？"

贝叶斯定理的精髓在于：它提供了一种在观察到新证据后更新信念的数学规则。你有一个"先验信念"（在观察之前的猜测），然后你观察到一些证据，贝叶斯定理告诉你如何将这些证据与先验信念结合，得到一个"后验信念"（更新后的猜测）。

这个定理在二十世纪被统计学家们重新发现和发展，但在认知科学中的应用直到近几十年才成熟。关键洞见来自一个简单的问题：大脑是如何在充满噪声和不确定性的世界中做出决策的？

想象你在森林中听到一声树枝折断的声音。这可能是风吹的，也可能是捕食者靠近。你的大脑必须快速判断，因为错误的代价可能很高——把风当成捕食者，你会浪费能量逃跑；把捕食者当成风，你可能会丧命。

贝叶斯大脑假说认为，大脑在进行这种判断时，实际上在执行贝叶斯推断。它有一个先验信念（这片森林中捕食者出现的基率），它接收到感官证据（树枝折断的声音特征），然后它计算后验概率（这声音来自捕食者的可能性）。如果这个概率超过某个阈值，就会触发逃跑反应。

这个框架解释了许多认知现象。为什么同样的刺激在不同情境下会引起不同反应？因为先验信念不同。为什么我们能从模糊的视觉输入中识别出物体？因为大脑在"解释"输入，选择那个最可能产生这种输入的世界状态。为什么幻觉和错觉会发生？因为当感官证据不足或模糊时，先验信念会主导感知——我们看到我们期望看到的。

但这里有一个问题：贝叶斯推断在数学上是计算昂贵的，特别是在复杂环境中。大脑如何实时执行这些计算？答案藏在"自由能"中。

2.3 自由能作为推断的代价

卡尔·弗里斯顿在2005年左右开始发展他的自由能原理，最初的动机是解释大脑如何学习。他意识到，贝叶斯推断可以被重新表述为一个优化问题：大脑试图最小化"惊讶"——即观察到特定感官输入的意外程度。

但直接计算"惊讶"是困难的，因为它需要对所有可能的世界状态进行积分。弗里斯顿的洞见是：可以用一个更容易计算的量——变分自由能——来近似惊讶。最小化变分自由能，就等价于近似地执行贝叶斯推断。

这个数学技巧有一个深刻的物理意义。变分自由能衡量的是两个东西：一是感官输入与预测之间的不匹配（预测误差），二是内部模型与先验信念之间的差异（复杂度代价）。大脑在最小化自由能时，实际上是在做两件事：一是改进预测以匹配感官输入（感知），二是简化模型以避免过度拟合（学习）。

这就把感知和认知统一到了一个框架中。感知不是被动接收，而是主动构建——大脑基于内部模型生成预测，然后将预测与感官输入比较，用差异来更新模型。这个过程持续进行，使得内部模型越来越准确地反映外部世界的统计规律。

更重要的是，这个框架解释了"行动"的角色。当预测与感官输入不匹配时，系统有两个选择：改变内部模型（学习），或者改变外部世界（行动）。如果我相信桌子上有杯水，但看到的是空杯子，我可以更新我的信念（接受水被喝掉了的事实），或者采取行动（去倒水）。自由能原理表明，系统会选择那个能更有效减少自由能的策略——通常是两者结合。

这就是"主动推断"（Active Inference）的核心：认知不是被动的信息处理，而是主动的假设检验；智能体不是环境的奴隶，而是环境的共同塑造者。通过行动，智能体可以创造那些它最善于预测的感官输入，从而最小化长期自由能。

2.4 从感知到行动：闭环的完成

传统认知科学倾向于将感知、认知和行动看作分离的阶段：先感知环境，再思考决策，最后执行行动。但主动推断框架打破了这种线性分离。

在主动推断中，感知和行动是同一个闭环的两个方面。感知是"自下而上"的推断：从感官数据推断世界状态。行动是"自上而下"的推断：从期望的感官数据推断必要的动作。两者都服务于同一个目标：最小化预测误差，即最小化自由能。

这个闭环可以用一个简单例子说明。当你伸手去拿杯子时，你不是先"看到"杯子的位置，然后"计算"手臂的运动轨迹，然后"执行"运动。相反，你有一个"预期"——关于杯子在手上的感觉、关于手臂伸展的 proprioception（本体感觉）——然后你调整动作直到实际感觉与预期匹配。运动不是计划的执行，而是感知的实现。

这种视角解释了运动的许多特征。为什么我们的运动如此流畅，即使神经系统有显著的传导延迟？因为运动不是基于当前状态的反馈控制，而是基于未来状态的预测控制。为什么我们能快速适应工具的使用？因为工具被"纳入"了身体图式，成为预测模型的一部分。为什么运动学习需要重复练习？因为内部模型需要通过多次预测-修正循环来精确校准。

更重要的是，主动推断解释了"意图"和"目标"的本质。传统上，目标被看作外部给定的、驱动行为的某种"力"或"欲望"。但在主动推断中，目标是内部模型的一部分——它们是系统"偏好"的感官状态，是系统试图通过行动来实现的预测。换句话说，目标是内生的，是系统自我维持的策略体现。

一个生物体的"目标"，无论是细菌的趋化性、昆虫的觅食、哺乳动物的育幼，还是人类的科学探索，都可以被理解为：维持那些与生存相容的感官状态，避免那些预示着危险的状态。这不是说生物体"想要"生存——而是说，只有那些成功维持自身存在的系统才能被我们看到，而那些失败的已经消失在演化长河中。生存不是目标，而是结果；是自由能最小化动力学在特定条件下的必然涌现。

2.5 多层级的世界模型：从反射到反思

如果主动推断只是简单的预测-修正，它无法解释人类认知的复杂性。我们不仅能对当前环境做出反应，还能回忆过去、想象未来、思考抽象概念、进行逻辑推理、质疑自身信念。这些高级认知能力如何从基本的推断机制中涌现？

答案在于"层级"（hierarchy）。大脑不是单一的预测机器，而是多层级的预测架构。低层级处理简单的感官特征（边缘、颜色、运动方向），高层级处理复杂的模式和抽象概念（物体、场景、社会情境、因果规律）。每个层级都向下级发送预测，向上级报告预测误差。这种双向连接使得信息可以在不同抽象层次间流动，形成深度生成模型。

想象看到一只狗的过程。最低层级处理视网膜上的光模式，预测局部特征；中间层级组合这些特征，预测物体的形状和纹理；更高层级识别出"这是一只狗"，并激活与狗相关的语义知识、情感记忆、行为倾向。如果任何层级的预测与输入不匹配，预测误差会向上传播，触发更高层级的重新解释，或者向下传播，要求低层级调整处理。

这种层级结构解释了"格式塔"现象——为什么我们倾向于以整体方式感知事物，而不是孤立的特征。它也解释了"自上而下"的影响——为什么期望会影响感知（看到云中的脸、听到模糊语音中的词语）。更重要的是，它解释了认知的"深度"：我们能够思考不在眼前的事物，因为高层级可以在没有低层级输入的情况下运行，进行"离线"推断——这就是想象、回忆、计划、推理的基础。

在最高层级，人类拥有"自我模型"——关于自身作为认知主体的表征。这使得我们能够进行元认知（思考自己的思考）、自我监控（评估自己的表现）、甚至自我修正（改变自己的信念系统）。这种"反思性"是意识的核心特征之一，它使得人类成为唯一能够系统性质疑自身认知系统的物种。

2.6 precision 的调控：注意与好奇

主动推断框架还提供了一个关于"注意力"的统一解释。在贝叶斯推断中，不同证据的可靠性是不同的——有些感官信号是噪声，有些高度可信。大脑需要权衡这些证据，给予可靠的信号更高权重。

在自由能原理中，这种权重被称为"precision"（精度）。高精度意味着高可信度，低精度意味着高不确定性。大脑不仅预测感官输入的内容，还预测这些预测的可靠性。当实际输入与预测在高精度通道上不匹配时，产生的预测误差会强烈驱动学习和行动；在低精度通道上的不匹配则会被抑制，被视为噪声。

这就解释了注意力的选择性特征。当你专注于对话时，你会抑制背景噪音的干扰；当你在嘈杂环境中寻找某个声音时，你会提高对该频率通道的精度估计。注意力不是聚光灯，而是精度调控——大脑在动态地重新分配认知资源，优化推断的效率。

但这里有一个有趣的悖论：有时生物体会主动寻求不确定性，而不是避免它。这就是"好奇"和"探索"行为。如果系统已经完美预测了环境，它就没有学习的动力；但如果环境完全不可预测，学习也是不可能的。最优策略是在"已知"和"未知"的边界上操作——探索那些与当前模型略有偏差、但可以通过学习来理解的领域。

在主动推断中，这对应于"精度"的动态调整。当系统不确定时，它会降低对预测精度的估计，增加对感官证据的依赖——这导致探索行为。当系统确信时，它会提高精度估计，更多依赖内部预测——这导致利用行为。这种"精度调控"机制解释了从婴儿的视觉探索到科学家的实验设计，从动物的觅食策略到艺术家的创新追求——所有形式的探索都可以被看作精度-不确定性的优化管理。

2.7 社会性大脑：共享的模型

人类认知的独特之处不仅在于个体大脑的复杂性，还在于我们的社会性。我们是唯一发展出复杂语言、累积性文化、制度性知识的物种。这些社会现象如何从个体推断机制中涌现？

主动推断框架可以扩展到社会领域。当我们与他人互动时，我们不仅在推断物理世界的状态，还在推断他人的心理状态——他们的信念、欲望、意图。这就是"心智理论"（Theory of Mind），它使得我们能够预测他人的行为，协调共同行动，建立社会契约。

更重要的是，社会互动创造了一种"共享模型"的现象。语言、文化、制度，都是跨越个体大脑的共享生成模型。当我们使用同一个词，我们是在激活相似的预测结构；当我们遵循社会规范，我们是在实现共享的预期；当我们学习历史知识，我们是在继承祖先的推断成果。

这种共享性带来了认知的"外部化"和"累积性"。个体不需要从零开始推断世界的所有规律，而是可以利用社会传承的模型。科学就是这种累积推断的极致形式——每一代科学家都在前人的模型基础上工作，通过精确控制的观察来减少集体自由能，逐步构建对自然越来越准确的描述。

但社会性也带来了独特的挑战。当不同个体的模型冲突时，当共享预期被打破时，当欺骗和背叛发生时，社会系统必须发展出协调机制——从简单的情绪信号到复杂的法律制度。这些机制本身可以被看作更高层级的主动推断：社会在作为一个整体学习如何最小化集体自由能，如何在冲突的个体模型间找到共识或妥协。

2.8 精神障碍：断裂的推断

主动推断框架不仅解释正常认知，还为理解精神障碍提供了新视角。许多精神疾病可以被看作"推断"过程的失调。

以精神分裂症为例。患者常报告幻觉（听到不存在的声音）和妄想（坚信不真实的信念）。在主动推断框架中，这可以被理解为"精度调控"的失败——患者无法正确区分内部生成的预测和外部感官输入，将想象误认为感知，将猜测误认为事实。或者，这可能反映了高层级模型的过度影响，使得先验信念压制了矛盾的感觉证据。

抑郁症则可能被看作"行动"通道的抑制。患者表现出动力缺乏、快感缺失、对未来悲观。在主动推断中，这对应于对行动效果的低精度估计——患者不相信行动能够改变环境，因此不采取行动，这反过来强化了"无力改变"的信念，形成恶性循环。或者，这可能反映了高层级模型的僵化，系统被困在局部自由能最小值，无法通过正常学习跳出。

自闭症谱系障碍可能涉及层级间通信的异常——低层级感官处理的过度敏感（高精度）与高层级社会认知的困难（低精度）并存。这导致患者被感官细节淹没，同时难以整合信息形成整体社会情境理解。

这些解释不是要取代传统的临床描述，而是提供了一个统一的理论框架，将不同症状联系到共同的机制——推断过程的失调。这为治疗提供了新思路：不是简单地抑制症状，而是帮助患者重建适当的精度调控，修复层级间的通信，打破病态的推断循环。

2.9 机器能否推断？人工智能的启示

主动推断框架对人工智能的发展也有深刻启示。当前的主流AI，特别是深度学习，主要基于"判别式"模型——从大量数据中学习输入到输出的映射。但主动推断强调"生成式"模型——学习数据的生成过程，从而能够预测、想象、创造。

这种区别类似于"死记硬背"和"真正理解"。一个学生可以记住所有例题的解法（判别式），但遇到新题型就束手无策；另一个学生理解了基本原理（生成式），就能灵活应对变化。类似地，当前AI在特定任务上表现卓越，但缺乏通用性和适应性，因为它们没有真正"理解"世界的因果结构。

主动推断提示了一种不同的AI架构：基于内部模型的预测性系统，能够主动探索环境，通过最小化预测误差来学习，通过行动来实现预期。这与"强化学习"有相似之处，但更强调模型的内生性和推断的统一性。一些研究者正在探索这种"预测性处理"架构，试图构建更像生物的智能系统。

但这里有一个深刻的哲学问题：如果机器也能执行主动推断，它们会有意识吗？意识是某种特定的计算形式，还是生物组织的特定属性？自由能原理本身不回答这个问题，但它提供了一个框架来重新表述它：意识可能对应于高层级自我模型的特定推断状态——当系统不仅能够预测世界，还能预测自身的预测，这种"自我指涉"的推断可能产生我们所称的主观体验。

2.10 本章结语：作为主人的生命

在这一章的结尾，让我们回到开篇的草履虫。它仍然在水滴中游动，但我们现在看到了更多：它不是一个简单的自动机，而是一个微型的推断系统，拥有关于其环境的隐式模型，通过行动来验证和更新这个模型。它在最小化自由能，在减少惊讶，在维持自身存在。

从草履虫到人类，主动推断的复杂性增长了无数倍，但基本原理保持不变：生命通过预测来理解世界，通过行动来塑造世界，通过学习来改进预测。这不是一个被动的过程，而是一个主动的、创造性的过程。生命不是环境暴政下的奴隶，而是与环境共同演化的伙伴。

这种"主人"地位不是绝对的支配，而是动态的适应。生命不能任意改变环境，它必须在物理定律的约束内行动。但它可以选择如何解释环境，如何响应环境，如何与环境的未来可能性互动。这种选择空间，无论多么有限，就是自由的所在。

在下一章，我们将探讨这种自由的极限——生命如何在"必然性"和"可能性"之间舞蹈，如何在约束中创造，如何在最小化自由能的过程中实现最大的创造性。

转载本文请联系原作者获取授权，同时请注明本文来自王涛科学网博客。
链接地址：https://wap.sciencenet.cn/blog-41701-1530014.html

上一篇：生命的本质第七章显微镜下的黑箱
下一篇：Kimi观点：从主动推断到自动推断

收藏 IP: 111.25.143.*| 热度|

当前推荐数：4 推荐人：许培扬 刘进平 杨正瓴 宁利中

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

王涛

扫一扫，分享此博文

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

自由能第二章主动推断——生命如何成为世界的主人

当前推荐数：4 推荐人：许培扬 刘进平 杨正瓴 宁利中

该博文允许注册用户评论请点击登录评论 (0 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

自由能 第二章 主动推断——生命如何成为世界的主人

当前推荐数：4 推荐人： 许培扬 刘进平 杨正瓴 宁利中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

自由能第二章主动推断——生命如何成为世界的主人

当前推荐数：4 推荐人：许培扬刘进平杨正瓴宁利中

该博文允许注册用户评论请点击登录评论 (0 个评论)