||
第二章:主动推断——生命如何成为世界的主人
2.1 从反应到预测:认知的革命
想象一只单细胞生物,比如草履虫,在显微镜下的水滴中游动。它的世界是简单的:化学梯度、温度变化、光线的明暗。当环境变得不利——比如盐分过高——它会收缩,改变游动方向,寻找更适宜的区域。
这看起来只是简单的"刺激-反应":环境变化→生物反应。但如果我们仔细观察,会发现一些微妙之处。草履虫并不是在感受到不适之后才随机尝试方向,它的运动模式似乎带有某种"目的性"——它倾向于游向之前发现过营养的区域,避开曾经遭遇过危险的地方。
这种"目的性"长期以来被排除在严肃科学讨论之外。十九世纪的生物学家可能会用"向性"(tropism)来描述这种现象——植物向光、根部向水——但向性被认为只是物理化学反应的机械结果,不涉及任何"认知"或"意图"。生命被看作复杂的机器,输入决定输出,没有中间环节。
但这种观点在二十世纪后半叶开始瓦解。认知科学的兴起,特别是控制论和人工智能的早期发展,让人们意识到:即使是简单的生物,也在进行某种形式的"信息处理"。它们不仅仅是被动地响应环境,而是在"表征"环境——它们的内部状态以某种方式对应着外部世界的特征,这种对应使得它们能够"预期"未来并据此行动。
这就是"认知"的核心:不是拥有复杂的神经系统,而是拥有关于世界的"模型"——无论这个模型多么简单——并能够用这个模型来指导行为。从这个角度看,草履虫在化学梯度中的游动,细菌在营养浓度中的趋化运动,甚至病毒在宿主细胞表面的识别,都是某种形式的"认知"——它们都在基于内部结构对外部世界进行"推断"。
2.2 贝叶斯大脑:不确定性的驯服者
要理解这种"推断"的本质,我们需要引入一个十八世纪牧师的发明——贝叶斯定理。
托马斯·贝叶斯(Thomas Bayes)是一位英国长老会牧师,他在1763年发表的论文中提出了一种计算"逆概率"的方法。传统概率回答的问题是:"已知硬币是公平的,抛出正面的概率是多少?"而贝叶斯关心的是逆问题:"已知抛出了十次正面,硬币是公平的概率是多少?"
贝叶斯定理的精髓在于:它提供了一种在观察到新证据后更新信念的数学规则。你有一个"先验信念"(在观察之前的猜测),然后你观察到一些证据,贝叶斯定理告诉你如何将这些证据与先验信念结合,得到一个"后验信念"(更新后的猜测)。
这个定理在二十世纪被统计学家们重新发现和发展,但在认知科学中的应用直到近几十年才成熟。关键洞见来自一个简单的问题:大脑是如何在充满噪声和不确定性的世界中做出决策的?
想象你在森林中听到一声树枝折断的声音。这可能是风吹的,也可能是捕食者靠近。你的大脑必须快速判断,因为错误的代价可能很高——把风当成捕食者,你会浪费能量逃跑;把捕食者当成风,你可能会丧命。
贝叶斯大脑假说认为,大脑在进行这种判断时,实际上在执行贝叶斯推断。它有一个先验信念(这片森林中捕食者出现的基率),它接收到感官证据(树枝折断的声音特征),然后它计算后验概率(这声音来自捕食者的可能性)。如果这个概率超过某个阈值,就会触发逃跑反应。
这个框架解释了许多认知现象。为什么同样的刺激在不同情境下会引起不同反应?因为先验信念不同。为什么我们能从模糊的视觉输入中识别出物体?因为大脑在"解释"输入,选择那个最可能产生这种输入的世界状态。为什么幻觉和错觉会发生?因为当感官证据不足或模糊时,先验信念会主导感知——我们看到我们期望看到的。
但这里有一个问题:贝叶斯推断在数学上是计算昂贵的,特别是在复杂环境中。大脑如何实时执行这些计算?答案藏在"自由能"中。
2.3 自由能作为推断的代价
卡尔·弗里斯顿在2005年左右开始发展他的自由能原理,最初的动机是解释大脑如何学习。他意识到,贝叶斯推断可以被重新表述为一个优化问题:大脑试图最小化"惊讶"——即观察到特定感官输入的意外程度。
但直接计算"惊讶"是困难的,因为它需要对所有可能的世界状态进行积分。弗里斯顿的洞见是:可以用一个更容易计算的量——变分自由能——来近似惊讶。最小化变分自由能,就等价于近似地执行贝叶斯推断。
这个数学技巧有一个深刻的物理意义。变分自由能衡量的是两个东西:一是感官输入与预测之间的不匹配(预测误差),二是内部模型与先验信念之间的差异(复杂度代价)。大脑在最小化自由能时,实际上是在做两件事:一是改进预测以匹配感官输入(感知),二是简化模型以避免过度拟合(学习)。
这就把感知和认知统一到了一个框架中。感知不是被动接收,而是主动构建——大脑基于内部模型生成预测,然后将预测与感官输入比较,用差异来更新模型。这个过程持续进行,使得内部模型越来越准确地反映外部世界的统计规律。
更重要的是,这个框架解释了"行动"的角色。当预测与感官输入不匹配时,系统有两个选择:改变内部模型(学习),或者改变外部世界(行动)。如果我相信桌子上有杯水,但看到的是空杯子,我可以更新我的信念(接受水被喝掉了的事实),或者采取行动(去倒水)。自由能原理表明,系统会选择那个能更有效减少自由能的策略——通常是两者结合。
这就是"主动推断"(Active Inference)的核心:认知不是被动的信息处理,而是主动的假设检验;智能体不是环境的奴隶,而是环境的共同塑造者。通过行动,智能体可以创造那些它最善于预测的感官输入,从而最小化长期自由能。
2.4 从感知到行动:闭环的完成
传统认知科学倾向于将感知、认知和行动看作分离的阶段:先感知环境,再思考决策,最后执行行动。但主动推断框架打破了这种线性分离。
在主动推断中,感知和行动是同一个闭环的两个方面。感知是"自下而上"的推断:从感官数据推断世界状态。行动是"自上而下"的推断:从期望的感官数据推断必要的动作。两者都服务于同一个目标:最小化预测误差,即最小化自由能。
这个闭环可以用一个简单例子说明。当你伸手去拿杯子时,你不是先"看到"杯子的位置,然后"计算"手臂的运动轨迹,然后"执行"运动。相反,你有一个"预期"——关于杯子在手上的感觉、关于手臂伸展的 proprioception(本体感觉)——然后你调整动作直到实际感觉与预期匹配。运动不是计划的执行,而是感知的实现。
这种视角解释了运动的许多特征。为什么我们的运动如此流畅,即使神经系统有显著的传导延迟?因为运动不是基于当前状态的反馈控制,而是基于未来状态的预测控制。为什么我们能快速适应工具的使用?因为工具被"纳入"了身体图式,成为预测模型的一部分。为什么运动学习需要重复练习?因为内部模型需要通过多次预测-修正循环来精确校准。
更重要的是,主动推断解释了"意图"和"目标"的本质。传统上,目标被看作外部给定的、驱动行为的某种"力"或"欲望"。但在主动推断中,目标是内部模型的一部分——它们是系统"偏好"的感官状态,是系统试图通过行动来实现的预测。换句话说,目标是内生的,是系统自我维持的策略体现。
一个生物体的"目标",无论是细菌的趋化性、昆虫的觅食、哺乳动物的育幼,还是人类的科学探索,都可以被理解为:维持那些与生存相容的感官状态,避免那些预示着危险的状态。这不是说生物体"想要"生存——而是说,只有那些成功维持自身存在的系统才能被我们看到,而那些失败的已经消失在演化长河中。生存不是目标,而是结果;是自由能最小化动力学在特定条件下的必然涌现。
2.5 多层级的世界模型:从反射到反思
如果主动推断只是简单的预测-修正,它无法解释人类认知的复杂性。我们不仅能对当前环境做出反应,还能回忆过去、想象未来、思考抽象概念、进行逻辑推理、质疑自身信念。这些高级认知能力如何从基本的推断机制中涌现?
答案在于"层级"(hierarchy)。大脑不是单一的预测机器,而是多层级的预测架构。低层级处理简单的感官特征(边缘、颜色、运动方向),高层级处理复杂的模式和抽象概念(物体、场景、社会情境、因果规律)。每个层级都向下级发送预测,向上级报告预测误差。这种双向连接使得信息可以在不同抽象层次间流动,形成深度生成模型。
想象看到一只狗的过程。最低层级处理视网膜上的光模式,预测局部特征;中间层级组合这些特征,预测物体的形状和纹理;更高层级识别出"这是一只狗",并激活与狗相关的语义知识、情感记忆、行为倾向。如果任何层级的预测与输入不匹配,预测误差会向上传播,触发更高层级的重新解释,或者向下传播,要求低层级调整处理。
这种层级结构解释了"格式塔"现象——为什么我们倾向于以整体方式感知事物,而不是孤立的特征。它也解释了"自上而下"的影响——为什么期望会影响感知(看到云中的脸、听到模糊语音中的词语)。更重要的是,它解释了认知的"深度":我们能够思考不在眼前的事物,因为高层级可以在没有低层级输入的情况下运行,进行"离线"推断——这就是想象、回忆、计划、推理的基础。
在最高层级,人类拥有"自我模型"——关于自身作为认知主体的表征。这使得我们能够进行元认知(思考自己的思考)、自我监控(评估自己的表现)、甚至自我修正(改变自己的信念系统)。这种"反思性"是意识的核心特征之一,它使得人类成为唯一能够系统性质疑自身认知系统的物种。
2.6 precision 的调控:注意与好奇
主动推断框架还提供了一个关于"注意力"的统一解释。在贝叶斯推断中,不同证据的可靠性是不同的——有些感官信号是噪声,有些高度可信。大脑需要权衡这些证据,给予可靠的信号更高权重。
在自由能原理中,这种权重被称为"precision"(精度)。高精度意味着高可信度,低精度意味着高不确定性。大脑不仅预测感官输入的内容,还预测这些预测的可靠性。当实际输入与预测在高精度通道上不匹配时,产生的预测误差会强烈驱动学习和行动;在低精度通道上的不匹配则会被抑制,被视为噪声。
这就解释了注意力的选择性特征。当你专注于对话时,你会抑制背景噪音的干扰;当你在嘈杂环境中寻找某个声音时,你会提高对该频率通道的精度估计。注意力不是聚光灯,而是精度调控——大脑在动态地重新分配认知资源,优化推断的效率。
但这里有一个有趣的悖论:有时生物体会主动寻求不确定性,而不是避免它。这就是"好奇"和"探索"行为。如果系统已经完美预测了环境,它就没有学习的动力;但如果环境完全不可预测,学习也是不可能的。最优策略是在"已知"和"未知"的边界上操作——探索那些与当前模型略有偏差、但可以通过学习来理解的领域。
在主动推断中,这对应于"精度"的动态调整。当系统不确定时,它会降低对预测精度的估计,增加对感官证据的依赖——这导致探索行为。当系统确信时,它会提高精度估计,更多依赖内部预测——这导致利用行为。这种"精度调控"机制解释了从婴儿的视觉探索到科学家的实验设计,从动物的觅食策略到艺术家的创新追求——所有形式的探索都可以被看作精度-不确定性的优化管理。
2.7 社会性大脑:共享的模型
人类认知的独特之处不仅在于个体大脑的复杂性,还在于我们的社会性。我们是唯一发展出复杂语言、累积性文化、制度性知识的物种。这些社会现象如何从个体推断机制中涌现?
主动推断框架可以扩展到社会领域。当我们与他人互动时,我们不仅在推断物理世界的状态,还在推断他人的心理状态——他们的信念、欲望、意图。这就是"心智理论"(Theory of Mind),它使得我们能够预测他人的行为,协调共同行动,建立社会契约。
更重要的是,社会互动创造了一种"共享模型"的现象。语言、文化、制度,都是跨越个体大脑的共享生成模型。当我们使用同一个词,我们是在激活相似的预测结构;当我们遵循社会规范,我们是在实现共享的预期;当我们学习历史知识,我们是在继承祖先的推断成果。
这种共享性带来了认知的"外部化"和"累积性"。个体不需要从零开始推断世界的所有规律,而是可以利用社会传承的模型。科学就是这种累积推断的极致形式——每一代科学家都在前人的模型基础上工作,通过精确控制的观察来减少集体自由能,逐步构建对自然越来越准确的描述。
但社会性也带来了独特的挑战。当不同个体的模型冲突时,当共享预期被打破时,当欺骗和背叛发生时,社会系统必须发展出协调机制——从简单的情绪信号到复杂的法律制度。这些机制本身可以被看作更高层级的主动推断:社会在作为一个整体学习如何最小化集体自由能,如何在冲突的个体模型间找到共识或妥协。
2.8 精神障碍:断裂的推断
主动推断框架不仅解释正常认知,还为理解精神障碍提供了新视角。许多精神疾病可以被看作"推断"过程的失调。
以精神分裂症为例。患者常报告幻觉(听到不存在的声音)和妄想(坚信不真实的信念)。在主动推断框架中,这可以被理解为"精度调控"的失败——患者无法正确区分内部生成的预测和外部感官输入,将想象误认为感知,将猜测误认为事实。或者,这可能反映了高层级模型的过度影响,使得先验信念压制了矛盾的感觉证据。
抑郁症则可能被看作"行动"通道的抑制。患者表现出动力缺乏、快感缺失、对未来悲观。在主动推断中,这对应于对行动效果的低精度估计——患者不相信行动能够改变环境,因此不采取行动,这反过来强化了"无力改变"的信念,形成恶性循环。或者,这可能反映了高层级模型的僵化,系统被困在局部自由能最小值,无法通过正常学习跳出。
自闭症谱系障碍可能涉及层级间通信的异常——低层级感官处理的过度敏感(高精度)与高层级社会认知的困难(低精度)并存。这导致患者被感官细节淹没,同时难以整合信息形成整体社会情境理解。
这些解释不是要取代传统的临床描述,而是提供了一个统一的理论框架,将不同症状联系到共同的机制——推断过程的失调。这为治疗提供了新思路:不是简单地抑制症状,而是帮助患者重建适当的精度调控,修复层级间的通信,打破病态的推断循环。
2.9 机器能否推断?人工智能的启示
主动推断框架对人工智能的发展也有深刻启示。当前的主流AI,特别是深度学习,主要基于"判别式"模型——从大量数据中学习输入到输出的映射。但主动推断强调"生成式"模型——学习数据的生成过程,从而能够预测、想象、创造。
这种区别类似于"死记硬背"和"真正理解"。一个学生可以记住所有例题的解法(判别式),但遇到新题型就束手无策;另一个学生理解了基本原理(生成式),就能灵活应对变化。类似地,当前AI在特定任务上表现卓越,但缺乏通用性和适应性,因为它们没有真正"理解"世界的因果结构。
主动推断提示了一种不同的AI架构:基于内部模型的预测性系统,能够主动探索环境,通过最小化预测误差来学习,通过行动来实现预期。这与"强化学习"有相似之处,但更强调模型的内生性和推断的统一性。一些研究者正在探索这种"预测性处理"架构,试图构建更像生物的智能系统。
但这里有一个深刻的哲学问题:如果机器也能执行主动推断,它们会有意识吗?意识是某种特定的计算形式,还是生物组织的特定属性?自由能原理本身不回答这个问题,但它提供了一个框架来重新表述它:意识可能对应于高层级自我模型的特定推断状态——当系统不仅能够预测世界,还能预测自身的预测,这种"自我指涉"的推断可能产生我们所称的主观体验。
2.10 本章结语:作为主人的生命
在这一章的结尾,让我们回到开篇的草履虫。它仍然在水滴中游动,但我们现在看到了更多:它不是一个简单的自动机,而是一个微型的推断系统,拥有关于其环境的隐式模型,通过行动来验证和更新这个模型。它在最小化自由能,在减少惊讶,在维持自身存在。
从草履虫到人类,主动推断的复杂性增长了无数倍,但基本原理保持不变:生命通过预测来理解世界,通过行动来塑造世界,通过学习来改进预测。这不是一个被动的过程,而是一个主动的、创造性的过程。生命不是环境暴政下的奴隶,而是与环境共同演化的伙伴。
这种"主人"地位不是绝对的支配,而是动态的适应。生命不能任意改变环境,它必须在物理定律的约束内行动。但它可以选择如何解释环境,如何响应环境,如何与环境的未来可能性互动。这种选择空间,无论多么有限,就是自由的所在。
在下一章,我们将探讨这种自由的极限——生命如何在"必然性"和"可能性"之间舞蹈,如何在约束中创造,如何在最小化自由能的过程中实现最大的创造性。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-12 19:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社