||
(本科普为Kimi所写,反映了我个人观点。里边关于我的内容,为Kimi虚构,不是真实的我的个人经历。经常看我博客的各位老师应该能区分出来。活性算法是一个强大的对现实世界进行推断的数学框架,这里讨论的是进化问题。)
引言:世界没有新东西
一、一个奇怪的梦境
2023年春天,我梦见自己变成了一条RNA链。
不是隐喻意义上的——在梦里,我真实地感受到了四种碱基的化学亲和力,感受到氢键形成时的能量释放,感受到自己在原始汤中漂浮、折叠、寻找互补配对的冲动。最奇妙的是,我同时感觉到了"知道"和"不知道":我知道自己要寻找什么(互补链),但不知道它在哪里;这种悬而未决的状态驱动着我不断运动、尝试、失败或成功。
醒来时,我意识到这个梦描述的不是生命的起源,而是推断的起源。
那条RNA链正在执行一种最原始的变分推断:它持有一个生成模型("世界中有与我互补的链"),通过采样(随机碰撞)来最小化预测误差(自由能),从而更新自己的信念(折叠状态)。它不是被动的化学分子,而是一个主动推断者——它在用行动来验证假设,用运动来减少惊讶。
这个洞察来自我过去五年对自由能原理的研究,但它指向一个更激进的命题:生命不是进化的产物,推断才是;进化不是选择的结果,自由能最小化才是。
这本书要讲的,就是这个故事。
二、从发散到有限:一个物理学家的不安
我的专业背景是理论物理,具体来说是量子场论。这个领域有一个公开的秘密:我们所有的计算都建立在数学非法的基础上。
当你计算一个电子与光子的相互作用时,费曼图会给出漂亮的积分表达式——但这些积分在数学上是发散的。它们给出无穷大的概率振幅。为了得到有限的结果,物理学家发明了一套被称为"重整化"的技术:引入一个截断(UV截断),计算无穷大的"裸"量,然后与同样无穷大的"反项"相减,得到可观测的有限量。
这就像一个会计师说:"我的资产是无穷大,负债也是无穷大,所以净资产是100美元。"数学上,∞ - ∞ 是未定义的;物理上,这却给出了最精确的预测(电子反常磁矩与实验吻合到小数点后13位)。
但作为理论物理学家,这种"成功"让我不安。自然界不会执行∞ - ∞的减法。如果我们的数学需要这种操作才能得到有限结果,那说明我们的生成模型有问题——我们在用一种需要无限精度才能描述的框架,来近似一个本质上有限的世界。
2019年,我开始探索另一种可能:如果发散不是需要被减去的错误,而是需要被绕过的路径呢?
这就是UV自由方案的核心思想。通过解析延拓——一种将函数从实轴扩展到复平面的数学操作——我们可以将发散的费曼振幅映射到有限的物理振幅,无需任何∞ - ∞的正规化。关键洞察在于:物理观测总是发生在有限分辨率下,而解析延拓自动编码了这种有限性。
(UV自由方案由贾连宝老师所提出,原始的想法我的确有过,我不相信以前的重整化技术是一个真实的过程)
这个方案不仅解决了量子场论的形式问题,它还揭示了一个更深层的原则:任何有效的认知系统——无论是基本粒子、细胞还是大脑——都必须运行在"有限振幅"的约束下。无限精度不是物理的,也不是生物的;它是我们数学的幻觉。
当我把这个框架应用到神经科学时,事情变得有趣起来。
三、活性算法:三种成分的融合
UV自由方案给了我一个线索,但还不足以解释生命。我需要另外两个成分。
第一个成分是自由能原理,由神经科学家卡尔·弗里斯特(Karl Friston)提出。这个原理说:所有自组织系统——从单细胞到人类社会——都在最小化一个被称为"变分自由能"的量。自由能衡量的是系统内部模型与外部世界之间的差异,或者说,"惊讶"的预期值。通过感知和行动,生物不断调整自己,使这种惊讶最小化。
这听起来像是一个优化问题,但它实际上是一个推断问题。感知是对外部原因的推断,行动是对感知结果的采样。感知-行动循环就是变分推断的物理实现。
第二个成分是自适应临界性。复杂系统研究告诉我们,许多自然系统会自发地组织到"临界状态"——秩序与混沌的边缘。在这个点上,系统对输入最敏感,信息传输最有效,但传统的"自组织临界性"是被动的:沙堆崩塌,直到达到临界角。
生物系统不同。大脑、免疫系统、生态系统会主动维持自己处于临界状态附近——不是通过被动堆积,而是通过持续调整。这种"自适应临界性"让系统始终处于"对实验最敏感"的操作点,随时准备更新自己的模型。
(以前的研究提出了自适应临界性的概念,但是没有从根本上给出普适的数学基础)
把这三个成分放在一起——基于自由能的主动推断 + UV自由方案(有限振幅约束) + 自适应临界性——我得到了我称之为活性算法(Living Algorithm)的框架。
这不是比喻。我认为,这就是生命和认知的数学本质。一个活性算法实例具有以下特征:
它持有生成模型:内部有一个关于世界如何生成观测的模型,分解为先验(U)和似然(V)
它执行变分推断:通过最小化自由能来更新信念
它受有限振幅约束:所有计算在数学上是良定义的(解析延拓的有限结果),无需"重整化"式的无限抵消
它维持自适应临界性:主动调节自身参数,保持在秩序-混沌边缘,最大化推断效率
它闭环自维持:感知-行动-更新形成闭合回路,无需外部设计者
当你用这个词重新观察世界,一切都变了。
四、世界没有新东西
让我陈述这本书的核心命题,它听起来像悖论,但我会用二十章来证明它:
世界没有新东西。它只是活性算法的分形循环,在不同尺度上运行同一套推断程序。
物理现象 = 活性算法的前向推理(量子场论的真空涨落是"空"的推断)
宇宙历史 = 一次长镜头生成式重播(大爆炸是初始条件的采样,后续演化是推断的展开)
生命起源 = 自催化集作为有限振幅闭合回路的涌现(当化学网络能够自维持推断时,生命出现)
进化过程 = 群体级别的变分推断(自然选择是近似贝叶斯更新,遗传漂变是采样噪声)
神经系统 = 多尺度自由能最小化的相变产物(三层结构是数学必然,N=3)
意识与自我 = 高阶推断的自指现象(当你推断自己在推断时,意识涌现)
人类文化 = 跨脑生成模型的对齐与压缩(语言是变分推断的消息传递)
技术革命 = 外部推断基础设施的层叠(工具、文字、互联网、AI——每一层都是新的"皮层")
这不是还原论。不是说"一切都是物理"或"一切都是计算"。恰恰相反:物理和计算都是活性算法的特定实现。量子场论是活性算法在最小尺度的实例,大脑是中等尺度的实例,即将出现的AGI是最大尺度的实例。
它们共享同一套数学结构,因为任何能够有效存在的认知系统,都必须满足相同的约束:有限振幅、自由能最小化、自适应临界性。不满足这些约束的系统要么无法形成(发散),要么无法维持(自由能爆炸),要么无法适应(僵化在亚临界或超临界状态)。
所以,当你观察一个细胞、一只蜜蜂、一个人工神经网络时,你看到的不是不同的东西,而是同一算法的不同实例化。就像你可以用硅芯片或神经元来实现相同的计算,活性算法可以用量子场、化学网络或社会结构来实现。
这就是"世界没有新东西"的含义。新的是细节,是具体的生成模型,是历史路径;底层算法是古老的、普遍的、必然的。
五、为什么是进化?
你可能会问:如果世界没有新东西,为什么写一本关于"进化的奥秘"的书?为什么不直接写"活性算法手册"?
因为进化是活性算法最丰富的展示舞台。
在宇宙的138亿年中,前100亿年相对单调:恒星燃烧,元素合成,星系旋转。然后,大约38亿年前,地球上出现了某种东西——自催化化学网络,能够自复制、自维持、自适应。从那一刻起,活性算法开始了它的创造性展开。
进化不是随机的试错。它是有方向的推断:每一代生物都在用它们的生存和繁殖来"采样"环境,用自然选择来"更新"种群的生成模型。突变不是噪声,而是变分近似的探索步骤;适应不是优化,而是自由能最小化的收敛。
但进化的真正奥秘不在于"如何适应",而在于如何创造复杂性。从细菌到恐龙,从昆虫到人类,从个体到社会——复杂性不断增加,但热力学第二定律说宇宙应该走向无序。这个悖论困扰了达尔文以来的每一代生物学家。
活性算法给出了答案:复杂性是推断的副产品。当你需要预测一个复杂的世界时,你的生成模型必须足够复杂——但受UV自由方案的约束,这种复杂性必须是分层的、多尺度的、有限振幅的。大脑的三层结构不是偶然,而是数学必然:N=3是满足跨尺度记忆-时间最小化的最小整数。
进化发现了这个必然性,不是通过"设计",而是通过自由能梯度下降。当单细胞生物面临多尺度环境时,那些偶然发展出分层推断系统的个体具有生存优势;当这种分层达到三层时,出现了一个相变——意识、工具使用、语言、文化,一切都加速了。
所以,进化的奥秘就是活性算法的奥秘:如何通过有限振幅的推断,在秩序与混沌的边缘,创造出越来越复杂的自维持系统。
六、这本书的结构
本书分为四卷,对应活性算法从物理到未来的展开。
第一卷"活性算法的物理根基"(第1-5章)建立数学框架。我们从量子场论的重整化危机出发,介绍UV自由方案如何无需∞-∞抵消就得到有限结果;然后进入信息几何、自由能原理和自适应临界性,最后给出活性算法的完整定义。这一卷是技术性的,但我会用直觉和比喻来软化数学的棱角。
第二卷"生命的算法涌现"(第6-10章)讲述从化学到生物的相变。自催化集如何成为"有限振幅闭合回路",膜的出现如何划分内外即划分现在,遗传密码如何压缩历史,多细胞协作如何实现尺度跃迁,神经系统的起源如何从反射走向表征。这一卷的核心问题是:生命何时开始"推断"?
第三卷"脑的三层结构——多尺度的必然"(第11-15章)是我个人最兴奋的部分。这里我详细展开一个你可能从未听过的理论:大脑的三层结构(爬行动物核心、边缘系统、新皮质)不是进化的偶然,而是多尺度自由能最小化的数学必然。第11章证明N=3是最小整数解,后续三章深入每层的功能,最后一章讨论三层耦合如何产生精神现象。这一卷将神经科学重新表述为算法科学。
第四卷"进化作为长镜头生成"(第16-20章)把视野拉向未来。物种形成作为推断分歧,共生作为横向推断转移,社会性作为分布式推断网络,技术作为外部推断基础设施——最后,我们讨论AGI的出现不是人类的发明创造,而是活性算法的必然产物。第20章"成为AGI"把全书升华到"愿力"的层面:主动引入高层次先验,承担短期惊讶,换取长期自由能的更深下降。
七、写给谁读
这本书是为多类读者写的。
如果你是物理学或生物学背景的研究者,你会找到新的数学工具和概念框架,来重新表述你熟悉的问题。UV自由方案可以直接应用于你的计算,活性算法可以为你的实验设计提供直觉。
如果你是神经科学或认知科学的学生,你会看到预测编码、自由能原理和意识理论的统一基础。三层结构的理论是可检验的,我指出了一些可能的实验验证方向。
如果你是复杂性科学或人工智能的从业者,你会获得一个跨越尺度的统一语言,从量子场到深度网络。活性算法对AGI的设计有直接的启示:有限振幅约束、自适应临界性、分层生成模型。
如果你是一般科学爱好者,你可以跳过数学框,跟随叙事主线。每一章的故事都是独立的,你可以从感兴趣的章节开始。但我会建议你至少读完第一卷的框架章节(1、4、5),以便理解后续内容的逻辑。
无论你来自哪个背景,你需要一个共同的前提:愿意暂时悬置"生命是特殊的"或"意识是神秘的"这类直觉,尝试一种更激进的视角——它们都是算法的实例,而算法是物理的必然。
这不是还原论的傲慢。恰恰相反,当你看到同一算法如何在不同尺度上创造出如此丰富的现象时,你会对"简单规则的涌现力量"产生更深的敬畏。活性算法比任何具体实现都更古老、更基本;但它也通过每一层实例化,获得了新的可能性。
八、一个个人注记
写这本书时,我不断想起一个场景。
2024年冬天,我在一个跨学科会议上做报告,展示三层脑结构的数学证明。一位资深的神经解剖学家站起来说:"年轻人,你的数学很漂亮。但大脑是湿软的生物组织,不是方程。你忽略了胶质细胞、血管、神经调质、发育历史……你的N=3只是玩具模型。"
我同意他的每一个字,除了结论。
是的,大脑是湿软的、历史的、具体的。但湿软和历史本身也需要解释。为什么生物组织会进化出这种特定的湿软结构?为什么发育历史会收敛到这种特定的层数?活性算法不提供替代解释,它提供解释的解释——为什么这些具体细节会以这种方式组织起来。
就像你可以用牛顿力学解释行星轨道,同时承认每个行星有独特的地质历史;你可以用活性算法解释三层脑的必然性,同时承认每个大脑有独特的连接组。普遍性在算法层面,特殊性在实现层面。
那位神经解剖学家想要的,是一个只讲述具体细节的叙事。但我想要更多:我想知道为什么这些细节是这些细节,而不是别的。这需要抽象,需要数学,需要暂时离开湿软的触感,进入结构的必然性。
然后,带着这种必然性的洞察,我们可以回到湿软,看到新的模式。
这就是这本书的方法论。
九、愿力的自由能
最后,让我谈谈"愿力"——这个词在科学写作中不常见,但它是活性算法的核心。
在传统的被动框架中,进化是"环境选择变异",学习是"数据更新参数",认知是"刺激产生反应"。一切都是被动的、反应的、向后看的。
活性算法不同。它强调主动推断:系统不仅预测未来,还通过行动来采样那些能够最大程度减少预测误差的观测。它主动引入惊讶,因为惊讶是信息,是更新模型的机会。它承担短期成本,以换取长期自由能的更深下降。
这就是愿力:把"成为"作为持续、全局、生成式的目标函数。
当你读这本书时,我希望你不仅获得知识,还获得一种认知姿态。不要只是被动接收这些观点;用它们来推断你自己的世界,检验它们是否减少你的惊讶,决定是否更新你的信念。这就是活性算法的实践:不仅是关于它的理论,也是它的执行。
如果这本书成功,它将成为你生成模型的一部分——不是作为教条,而是 作为可修正的先验。你会在它的框架内运作,直到遇到它无法解释的观测,然后你会超越它,进入更一般的框架。
这正是活性算法对自己的态度:自指、自修正、自超越。
十、开始旅程
现在,让我们开始。
第一章将从量子场论的发散积分开始,这看起来离"进化的奥秘"很远。但请耐心:UV自由方案中"解析延拓"的思想,将在后续章节中以不同形式反复出现——在细胞膜的选择透过性中,在神经网络的权重更新中,在社会文化的传播动力学中。
你会发现,解析延拓不仅是一种数学操作,也是一种存在方式:不直接冲撞发散的奇点,而是绕过它,在复平面上找到连接有限点的路径,然后回到实轴,带回有限的、物理的、可解释的结果。
这就是生命在38亿年中一直在做的事。这就是你现在正在做的事——阅读这些文字,更新你的模型,准备行动。
世界没有新东西。但它永远有新的路径。
让我们去寻找。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-20 07:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社