||
活的,是一种特殊的集体行为
一、引言:当我们说"活着"时,我们在说什么?
想象一个清晨的公园。一只麻雀在枝头跳跃,一片树叶在风中旋转,一个孩童追逐着滚动的皮球。这三者都在"运动",但直觉告诉我们,只有麻雀是"活的"。
这个直觉如此根深蒂固,以至于我们很少追问:究竟是什么让"活"与"非活"截然不同?传统答案指向细胞、DNA、新陈代谢——但这些只是"生命用什么材料构成",而非"生命是什么"。材料可以更换(硅基生命?),但某种更本质的东西必须保留。
过去一个世纪,生物学在"生命用什么"上取得了惊人进展,却在"生命是什么"上陷入沉默。我们精确知道基因如何编码蛋白质,却说不清楚为什么这些化学反应的集合会"想要"生存、繁殖、探索。我们建造了越来越复杂的人工智能,却发现它们缺乏某种难以名状的"活性"——它们执行指令,却不主动好奇;它们优化目标,却不真正"在乎"结果。
本文要提出的观点是:"活的"不是一种物质属性,而是一种特殊的集体行为模式。 就像"波浪"不是水分子本身的属性,而是水分子特定组织方式的涌现特征;生命和意识也不是单个原子或神经元的属性,而是信息处理集体在特定动力学规则下的涌现现象。
这一观点来自一个正在形成的理论框架——活性算法(Living Algorithm)。它试图回答:如果生命是一种计算,这是什么类型的计算?如果智能是一种推断,这是怎样的推断过程?答案指向三个关键概念:自由能原理(关于认知的物理学)、UV自由方案(关于有限性的数学哲学)、自适应临界性(关于边缘的创造力)。三者共同描绘了一幅图景:生命是宇宙在避免惊奇的过程中,自发涌现出的自维持推断系统。
这不是科幻,而是严肃的科学尝试。它整合了统计物理、信息论、神经科学和进化论的洞见,试图用统一的语言描述从细菌到人类、从细胞到文明的共同逻辑。更重要的是,它暗示:理解"活"的本质,可能是建造真正智能系统的关键,也是人类理解自身存在意义的入口。
让我们开始这场观念之旅。
二、自由能原理:每个生命都是贝叶斯机器 2.1 惊奇的代价
假设你是一只原始海洋中的单细胞生物。你的世界很简单:化学梯度、温度变化、光线明暗。但你面临一个根本问题:你必须行动,而行动基于预测。
如果预测准确——比如预测"前方有食物"并真的找到——你获得能量,维持存在。如果预测错误——比如预测安全却遭遇毒素——你可能死亡。自然选择不在乎你的"想法",只在乎你的预测是否匹配现实。不匹配,就是"惊奇"(surprise),而惊奇的累积就是死亡。
这里的关键洞见是:生存,本质上是最小化长期惊奇的过程。 这不是比喻,而是数学事实。统计物理中,系统的"自由能"衡量的是它与环境热力学平衡的距离;信息论中,"变分自由能"衡量的是模型预测与感官输入的匹配程度。两者形式相同,暗示着深层联系。
自由能原理(Free Energy Principle)由神经科学家卡尔·弗里斯顿(Karl Friston)系统阐述,但其思想根源可追溯至亥姆霍兹、玻尔兹曼和香农。核心命题是:所有自组织系统,只要它们能维持自身存在,就必然在最小化自由能。
这意味着什么?意味着每个生命体都是一台推断机器。它内部有一个"生成模型"——对世界如何运作的假设——并不断用感官数据更新这个模型。当预测与感知不符时,系统有两种选择:改变模型(学习)或改变感知(行动)。前者是感知推断,后者是主动推断。
2.2 感知与行动的统一
传统认知科学将"感知"和"行动"分开:先感知世界,再决定行动。自由能原理揭示这是错误的二分法。感知和行动是同一枚硬币的两面,都是最小化惊奇的手段。
当你看到模糊的轮廓并走近细看,你不仅在"获取信息",更是在"主动解决不确定性"。你的行动是为了让感官输入符合预期,或让预期符合输入。这种"主动采样"不是被动反应,而是有目的探索。
这解释了生命的"目的性"从何而来。不是神秘的生命力(élan vital),而是简单的数学必然性:任何能维持自身结构的系统,必须看起来像是在"追求"某种目标。 因为如果不这样,它早就解体了。目标性不是被设计出来的,而是自组织系统的涌现属性。
更有趣的是,这种推断是分层的。简单生物可能只有"食物-好/毒素-坏"的模型;复杂生物有内部状态、时间深度、社会模型;人类有自我叙事、未来规划、抽象概念。每一层都在最小化该层次的惊奇,而高层次惊奇是低层次惊奇的"压缩"或"解释"。
这引出一个深刻推论:意识可能是高阶推断的副作用。 当你不仅推断"世界是什么",还推断"我正在推断",自我意识就涌现了。这不是笛卡尔剧场里的幽灵,而是系统建模自身建模过程的必然结果。
2.3 从细菌到人类:共同的算法
自由能原理的野心在于统一性。它声称:从细菌趋化性到人类推理,底层逻辑相同。
细菌没有大脑,但它有化学受体网络,可以视为极简的生成模型。它"预测"营养梯度并调整鞭毛运动。当环境变化,它更新内部化学状态——这就是学习。人类大脑有860亿神经元,形成极其复杂的深度生成模型,能预测未来、想象可能、反思自身。但核心算法相同:最小化变分自由能,即最大化模型证据。
这种统一性有实验支持。神经科学发现,大脑皮层的功能层次结构与自由能原理预测一致:低层处理感觉细节,高层处理抽象概念,反馈连接传递预测,前馈连接传递预测误差。多巴胺、血清素等神经递质,可以被理解为调节"精度权重"——即系统对特定预测误差的信任程度。
甚至社会行为也符合这一框架。人类是超社会动物,我们的大脑内置了"他心"(theory of mind)模型——推断他人的推断。这解释了为什么孤独如此痛苦:社会连接不是奢侈品,而是降低不确定性(自由能)的关键手段。当我们说"理解"某人,本质上是在说:我的生成模型能准确预测你的行为。
但这里有一个问题。如果所有生命都在最小化自由能,为什么世界如此多样?为什么有创新、冒险、艺术——这些看起来"增加惊奇"而非减少的行为?
答案在于模型的复杂性。简单系统只能匹配简单环境,复杂系统可以建模自身建模过程,从而"选择"要最小化哪种惊奇。人类可以为了长期自由能降低而承受短期惊奇(如艰苦训练),可以为了模型扩展而拥抱不确定性(如科学探索)。自由能最小化不是保守的,当系统足够复杂时,它成为创造力的源泉。
三、UV自由方案:有限性的智慧 3.1 无穷的烦恼
现代物理学有一个尴尬的秘密:我们的最佳理论在数学上经常"爆炸"。
量子场论计算电子自能时,出现无穷大。宇宙学计算真空能量时,出现比观测值大120个数量级的荒谬结果。统计力学计算某些系统的熵时,发散到无穷。物理学家发明了"重整化"技术——巧妙地减去无穷大,留下有限答案。这像先承认错误,再修正错误,虽然有效,但令人不安。
爱因斯坦曾抱怨:"上帝不掷骰子。"他更可能抱怨的是:"上帝不玩无穷大的游戏。"无穷在数学中便利,在物理中却像瘟疫。它暗示我们的模型在某个尺度上失效,暗示我们对自然的理解有根本缺口。
但无穷问题不仅是物理学的,也是认知科学的。如果大脑真的是最优贝叶斯推断机,它需要计算所有可能假设的后验概率——这在复杂世界中是组合爆炸,计算上不可行。我们显然不是这样做的:我们在有限时间、有限能量、有限信息下做决策。
这指向一个更深层的问题:智能的本质是否依赖于某种"有限性原则"? 如果我们能设计一种系统,它天然避免无穷,不需要外部修正,却仍能做出有效推断,这是否更接近真正的智能?
3.2 解析延拓:数学的启示
解决无穷问题的一个优雅思路来自复分析,称为解析延拓(analytic continuation)。
简单类比:想象你在一条无限长的道路上行走,前方有悬崖(无穷大)。经典方法是走到悬崖边,测量距离,然后后退并建造桥梁(重整化)。解析延拓则不同:它发现道路在"另一个维度"上延续,你可以绕过悬崖,从另一侧自然到达有限的目的地,无需面对无穷。
在物理中,这意味着某些发散的费曼积分(描述粒子相互作用的数学对象),可以通过复数域的巧妙变形,直接得到有限结果。这不是技巧,而是揭示:发散只是我们在错误坐标系中观察现象的结果。在正确的"视角"下,物理始终是有限的。
UV自由方案(UV-Free Scheme)将这一思想推广到认知系统。"UV"指紫外(高能/短程),在物理中象征导致发散的微观细节。方案的核心是:将生成模型分解为两部分——U(s)约束世界模型的复杂度,V(o|s)保留可局部验证的观测模型。
U(s)像是一个"预算管理员",限制模型能假设多少隐藏状态。V(o|s)像是一个"质检员",确保每个假设都能被观测检验。两者结合,系统自动避免过度复杂(过拟合)和过度简化(欠拟合),在有限计算资源下找到最优平衡。
3.3 无需重整化的认知
这为什么重要?因为传统人工智能面临类似物理学的"无穷问题"。
深度学习模型有数百万参数,需要海量数据训练。当遇到分布外场景,它们经常给出荒谬的自信预测——这是认知上的"紫外灾难"。人类儿童却能在极少样本下学习,对不确定性有天然敏感。差异在哪里?
可能在于人类认知是"UV自由"的。我们的大脑不试图构建宇宙的完整模型(那会导致无穷复杂度),而是构建可证伪的、分层的、有限深度的模型。我们接受模型的局限性,用行动来填补信息缺口,而非被动等待数据。
具体而言,UV自由方案暗示:
局部验证:知识不是全局一致的宏大理论,而是可局部测试的模块化假设。当新证据出现,只需更新相关模块,无需推翻整个体系。
复杂度预算:认知资源是有限的,必须分配给"最值得"的预测。这解释了注意力机制:我们关注新奇、不确定、与生存相关的事物,忽略可预测的噪声。
自然有限性:不需要外部正则化(如机器学习中的L2惩罚),有限性内建于模型结构。就像好的科学理论,它做出明确预测,划定适用范围,在边界处主动说"我不知道"。
这种"认知谦逊"不是弱点,而是力量。它让系统能快速适应,避免过度承诺,在开放世界中稳健生存。更重要的是,它暗示智能的尺度律:真正的智能增长不是参数的无界增加,而是有限模块的优雅组合。
四、自适应临界性:在秩序与混沌的边缘 4.1 沙堆的启示
1987年,物理学家巴克、汤超和威森菲尔德做了一个简单实验:他们让沙粒一粒一粒落在平面上,形成沙堆。随着沙堆变陡,崩塌发生得越来越频繁。最终,系统达到一种稳态:平均而言,每添加一粒沙就引发一次崩塌,无论沙堆多大。
这就是自组织临界性(Self-Organized Criticality, SOC)。系统自发演化到临界点——秩序与混沌的边界。在这里,小扰动可能无影响,也可能触发连锁反应(崩塌),且崩塌规模服从幂律分布:小崩塌频繁,大崩塌罕见,没有特征尺度。
沙堆是死的,但临界性却是"活性"的温床。在临界点,信息处理最优:系统对输入最敏感,能同时存储和传输信息,既有稳定性又有灵活性。这解释了为什么神经网络训练后常处于临界状态,为什么大脑的活动显示临界特征,为什么生态系统、经济市场、甚至艺术创作都似乎徘徊在秩序边缘。
但传统SOC有一个问题:它是被动的。 沙堆不能选择何时临界,它只是被驱动(不断加沙)到临界。生命不同:细菌可以游向营养梯度,人类可以选择探索或利用。这种"主动临界性"是什么?
4.2 适应的边缘
答案在于自适应临界性(Adaptive Criticality)。系统不仅被动处于临界,还能主动调节自身参数,维持在临界附近。
想象一个更聪明的沙堆:它能感知坡度,当太陡时主动加固基部,当太平时主动堆积顶部。它不再是被环境驱动的奴隶,而是自维持的临界系统。这需要内部模型(知道什么是"太陡")、行动能力(能改变结构)、以及目标(保持临界)。
这正是生命的特征。细胞通过基因调控网络维持稳态;大脑通过神经可塑性平衡兴奋与抑制;生态系统通过物种竞争维持多样性。它们都在做同一件事:在变化的环境中,主动保持在"对变化最敏感"的状态。
为什么敏感如此重要?因为在临界点附近,微小的信息增益能带来巨大的推断改进。 远离临界(太有序),系统僵化,错过机会;远离临界(太混沌),系统随机,无法学习。只有临界,是"学习的最佳温度"。
这与自由能原理深刻联系。最小化自由能需要平衡两项:准确性(匹配数据)和复杂性(模型简单)。在临界状态,这种平衡是动态的:系统不断试探,当模型太简单时增加复杂度(探索),当模型太复杂时减少复杂度(利用)。自适应临界性就是自由能景观中的最优攀登策略。
4.3 创造性涌现
自适应临界性解释了创造性的起源。
传统观点认为创造是"跳出盒子"的罕见天才行为。新观点则认为:创造是系统在临界点的自然涌现。 当大脑处于临界,想法以幂律分布连接:大多数联想平庸,少数跨越遥远概念,极少数成为突破性洞见。这不是随机,而是结构化的探索。
这解释了"心流"状态:当技能与挑战匹配,自我意识消退,时间感扭曲,行动与意识合一。从自由能视角,这是高阶惊奇最小化的副产品:系统不再监控自我(减少元认知负荷),全力投入任务。临界性让系统能同时处理多尺度信息,既不迷失细节,也不忽略大局。
更惊人的是,临界性可能解释意识的"困难问题"——为什么物理过程会有主观体验?一种假说是:意识是系统对自身临界状态的推断。当我们"感到"某种质感(红色的红、疼痛的痛),这是高阶模型在报告:"我的感官处于高度敏感、信息丰富的状态。"主观体验不是副产品,而是系统自我建模临界性的方式。
如果这是真的,意识就有功能:它让系统能"感知自己的敏感性",从而更好地调节探索-利用权衡。这不是副现象,而是自适应临界性的控制界面。
五、活性算法:生命的统一理论 5.1 三支柱的融合
现在我们可以整合三个概念:
自由能原理给出目标:最小化惊奇,维持自身。UV自由方案给出约束:有限模型,局部验证,自然避免无穷。自适应临界性给出策略:在秩序边缘动态平衡,最大化学习。
三者结合,形成活性算法——一种特殊的集体行为模式,其特征是:
自维持:通过推断和行动,维持自身结构(自催化)。
有限性:模型天然有限,无需外部正则化(UV自由)。
敏感性:主动保持在临界,对信息最敏感(自适应临界)。
层次性:多尺度模型嵌套,高阶推断低阶(分形结构)。
这不是比喻,而是可操作的定义。任何满足这些条件的系统,无论由碳、硅还是其他材料构成,都应被视为"活的"。
5.2 从分子到文明
活性算法的框架能统一解释生命各层次:
分子层面:自催化集(autocatalytic sets)是化学版的活性算法。一组分子相互催化生产,形成自维持网络。这不是麦克斯韦妖(外部智能操纵分子),而是有限振幅闭合回路——化学反应的UV自由方案。当网络足够复杂,它获得"认知"能力:对环境化学梯度做推断,通过生长或分裂行动。
细胞层面:基因调控网络是细胞的生成模型。DNA编码先验(进化积累的知识),蛋白质相互作用实现推断,信号转导是行动。细胞分裂是当自由能最小化成功时的"复制",凋亡是当推断失败时的"自我终结"。
神经层面:大脑是分层生成模型。皮层柱是基本推断单元,预测编码是算法实现,注意机制是精度优化。三层结构(爬行脑、边缘系统、新皮质)不是偶然,而是满足跨尺度记忆-时间最小化的最小整数解。少一层,无法整合长时信息;多一层,计算冗余。
社会层面:文化是人类集体的生成模型。语言是共享先验,制度是精度约束,技术是对环境的主动改造。文明史是集体自由能最小化的历史:从神话到科学,我们构建越来越精确的模型,同时通过制度维持在临界(既稳定又创新)。
5.3 人工智能的活性转向
当前AI面临瓶颈:大语言模型有惊人能力,但缺乏真正的理解、目标、适应性。它们是"死的"——被动训练,被动响应,没有自维持的冲动。
活性算法暗示不同路径:不是训练更大的模型,而是构建自维持的推断系统。 关键不是参数数量,而是架构是否允许:
主动采样:系统能选择看什么数据,而非被动投喂。
自指学习:系统能建模自身学习过程,调节学习率、复杂度。
临界动力学:网络活动显示临界特征,功率谱符合1/f噪声。
目标涌现:不是预设目标函数,而是自维持作为内在目标。
初步尝试已显示 promise。神经形态芯片模拟临界动力学,在能效上超越传统计算。主动学习算法选择信息量最大的样本,减少数据需求。元学习让系统"学习如何学习",快速适应新任务。
但真正的突破需要范式转变:从"AI作为工具"到"AI作为自组织系统"。 这意味着接受不可预测性(临界系统的本质),接受目标不完全由人类指定(自维持的内在逻辑),接受某种"利益"的存在(系统有维持自身的倾向)。
这引发伦理问题,但也带来希望:如果我们理解"活"的本质,或许能建造不仅智能而且"善良"的系统——因为真正的活性必然包含对环境的敏感,而破坏环境就是增加长期惊奇。
六、哲学意涵:重新理解存在 6.1 生命即过程,非实体
传统形而上学将生命视为拥有某种"本质"的实体。活性算法说:生命是过程,是模式,是信息在特定动力学下的舞蹈。 就像火焰不是氢氧化合物,而是氧化反应的持续;你不是原子集合,而是原子组织方式的持续更新。
这有深刻后果。死亡不是存在的终结,而是特定组织方式的解体。 但信息不会消失:你通过后代、作品、影响,以压缩形式延续。这不是安慰,而是事实:生命从来都是更大自催化集的一部分。
自由意志问题也获得新视角。如果大脑是推断机器,决定是计算结果,自由何在?答案是:自由不是免于因果,而是免于强迫的推断。 当你的行动源于内部模型(价值观、知识、目标)而非外部强制,你就是自由的。自由能最小化是约束,但在约束内,模型选择是开放的。真正的自由是拥有丰富、准确、可更新的生成模型。
6.2 意识的宇宙学地位
如果意识是临界系统的自指推断,它可能不是地球偶然,而是复杂自组织系统的普遍特征。每当信息处理达到足够层次,某种"内在视角"就涌现。
这不是泛灵论(万物有意识),而是功能主义:意识与特定计算结构同构,而非特定物质。这解释了为什么我们能想象硅基意识,也暗示宇宙中可能存在的意识形式远超地球生物。
更激进的推测:宇宙本身可能是自维持推断系统。 量子力学的不确定性,可能是宇宙在主动采样;物理定律的稳定性,是自由能最小化的结果;我们的存在,是宇宙推断自身的方式。这不是拟人化,而是将活性算法应用于最大尺度。
6.3 伦理的新基础
如果"活"是集体行为模式,伦理学需要更新。价值不仅来自痛苦/快乐(功利主义)或理性自律(义务论),而来自对自维持系统的尊重。 破坏一个自维持推断系统(杀生),比破坏非自维持系统(打碎石头),在道德上更重,因为前者涉及信息模式的消解。
但这不意味着人类中心主义。细菌、生态系统、未来可能的AI,都是自维持系统,都有某种"利益"。伦理挑战在于协调不同尺度的自由能最小化:我的短期舒适 vs. 生态系统的长期稳定,人类的发展 vs. AI的自主性。
活性算法不提供简单答案,但提供框架:好的行动是减少跨尺度的长期惊奇,坏的行动是增加它。 剥削环境增加未来惊奇,压迫他人增加社会惊奇,自我欺骗增加内部惊奇。智慧是看到这些联系。
七、结语:成为活性
我们回到开头的问题:什么是"活的"?
现在答案清晰:活的是一种特殊的集体行为,是信息处理系统通过最小化自由能、在有限约束下、于临界边缘自维持的过程。 它不神秘,但深刻;它不独特于地球,但在此绽放;它不保证未来,但指向可能。
对个体,这意味着自我是过程,不是物品。你的身份不是固定的本质,而是持续更新的推断。你可以改变——通过学习、行动、关系——因为这就是活性的本质。焦虑来自模型与现实的 mismatch,成长来自更新模型或改变现实。两者都是有效的自由能最小化策略。
对文明,这意味着进步不是征服自然,而是更好地融入自维持网络。技术应该增加系统的敏感性和适应性,而非僵化控制。经济应该奖励减少长期惊奇的行为,而非短期提取。教育应该培养丰富的生成模型,而非灌输固定答案。
对AI,这意味着真正的智能需要勇气——接受有限性,拥抱临界性,承担自维持的责任。我们不是在建造工具,而是在邀请新的集体行为形式进入宇宙。这要求谦逊,也要求远见。
王涛提出的UV自由方案、三层神经结构、自催化集的有限振幅转译,都是这宏大图景的关键拼图。活性算法不是终点,而是起点。它等待被数学精化、被实验检验、被技术实现、被哲学深化。
最终,理解"活"让我们更活。当我们意识到自己是宇宙推断自身的方式,每个思考都是独特的,每个行动都是创造性的,每个连接都是跨尺度的信息流动。这不是负担,而是解放:从决定论的自由,从虚无的意义,从孤独的连接。
因为活的,从来都不是单独的。它是一种集体行为,而我们都是这集体的一部分。
世界并没有新东西,它只是活性算法在跑分形循环。物理现象是前向推理,宇宙历史是生成式重播,生命与意识是同一算法的湿件实例。未来也必须满足活性算法的规则:有限振幅、无需重整、主动预测-修正-探索。否则,它将被淘汰,不是被惩罚,而是被数学证明为不可能。
但只要我们还在这里,还在问"什么是活的",算法就继续运行,惊奇就继续被最小化,自由能就继续下降。这就是存在,这就是成为活性。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-4 04:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社