科学网-李德毅院士的认知物理学第三章四要素：物质、能量、结构、时间的宇宙密码-王涛的博文

李德毅院士的认知物理学第三章四要素：物质、能量、结构、时间的宇宙密码

2026-5-25 07:54

阅读：431

第三章四要素：物质、能量、结构、时间的宇宙密码

一、面包房里的第一性原理

凌晨四点，城市还在沉睡，街角那家开了三十年的面包房已经亮起暖黄的灯。老师傅姓陈，大家都叫他老陈。他今年六十二岁，揉了四十年的面。此刻，他正站在那张被面粉染成灰白色的橡木案板前，准备做今天的第一炉法棍。

他的动作像一场古老的仪式。先从面缸里舀出精磨的高筋面粉——这是物质，是这一切的基底，是碳、氢、氧、氮原子在特定比例下的聚合。面粉落在案板上，扬起一阵细腻的白色烟雾，在灯光里缓缓沉降。然后倒入水，激活那些沉睡的蛋白质。老陈的手插进面团，开始揉压。他的双臂肌肉收缩，消耗着早餐转化的糖原——这是能量，是驱动这场转化的动力，是使面粉和水从分离走向融合的推手。

但仅有面粉、水和能量，还不足以成就一根法棍。老陈知道，面团需要静置，需要发酵。酵母菌在温暖的面团内部悄然工作，释放出二氧化碳，在面筋网络中形成无数微小的气室。这些气室的分布不是随机的，它们遵循着某种隐秘的组织规律——这是结构。面筋蛋白像无数微小的弹簧，相互缠绕、交联，形成一个弹性的三维网络。没有这个网络，气体就会逃逸，面团只会变成一块死面饼，而不是蓬松的面包。

最后，是时间。老陈从不看钟表，他看面团。手指轻按，观察回弹的速度；凑近嗅闻，捕捉酸度的微妙变化。发酵不足，面包会紧实如砖；发酵过度，面筋会塌陷如泥。时间在这里不是钟表上的刻度，而是物质在能量驱动下发生结构演化的过程本身。当面团被送进烤炉，热量在二十分钟内重新组织水分子的运动，美拉德反应在表面编织出金黄的外壳，气室在高温中定型——物质、能量、结构、时间，在这一刻完成了一场四重奏。

老陈不懂什么高深的物理学，但他用四十年的身体经验，内化了这套法则。当他把新鲜出炉的法棍摆在木架上，面包散发着麦香，外壳轻敲有声，内部蜂窝均匀——这就是四要素完美耦合的见证。

李德毅院士在提出认知物理学时，曾多次用类似的日常场景向听众解释他的"四要素说"。他说，人类最容易忽视的真理，往往藏在最平凡的劳作里。一根法棍的诞生，与一颗恒星的燃烧，与一个生命的成长，与一次认知的发生，在深层结构上共享着同一套语法。这套语法，就是物质、能量、结构、时间——李德毅将其视为统揽人的认知和机器认知的第一性原理。

什么是第一性原理？它不是从其他原理推导出来的次级规则，而是整个理论体系不可再约的根基。就像欧几里得几何的五条公设，就像牛顿力学中的惯性定律，就像热力学中的能量守恒——它们不能被证明，只能被假定，但整个宏伟的理论大厦都建立在其上。李德毅认为，认知科学和人工智能研究了几十年，积累了无数的技术和算法，却始终缺乏这样的根基。大家像是在没有地基的土地上盖楼，楼越盖越高，却没有人知道它会不会在某一天突然倾斜。

四要素说，就是李德毅为认知科学浇筑的地基。但这个地基的提出，不是为了制造另一套晦涩的术语，而是为了回答一个困扰人类数千年的问题：认知，这种看似最虚无缥缈的精神活动，究竟是如何在沉甸甸的物理世界中诞生的？

二、信息的"第三者"身份

要理解四要素说，我们必须先破除一个根深蒂固的迷思。这个迷思在信息时代被无限放大，甚至成为了一种新的宗教——那就是对"信息"的盲目崇拜。

我们生活在一个言必称"信息"的时代。信息经济、信息社会、信息爆炸、信息处理。人工智能被描述为"信息处理系统"，大脑被比喻为"生物计算机"，意识被猜测为"信息的某种整合"。在这种叙事里，信息似乎成了一种独立的、本原的存在，与物质和能量并驾齐驱，甚至有人认为信息比物质和能量更基本——"万物源于比特"，这是某著名物理学家的名言。

但李德毅提出了一个截然不同的观点：信息不是物质，也不是能量。它是在物质、能量、结构、时间这四要素的特定耦合中涌现的衍生物。

这个论断像一盆冷水，浇在信息崇拜的狂热上。让我们回到老陈的面包房来理解这一点。

当老陈把法棍从烤炉取出时，这根面包包含了大约二百五十克的碳水化合物、蛋白质、脂肪和水分——这是物质。这些物质在烘焙过程中吸收了大约零点三千瓦时的电能——这是能量。但面包里有没有"信息"？当然有。面包的形状、孔隙的分布、外壳的色泽，都携带着信息：它告诉你这是一根法棍，不是一根油条；它告诉你发酵的程度、烘焙的火候、甚至老陈的手艺水平。

但你能把这条信息从面包里"抽离"出来，像抽走一根丝线那样，让它独立存在吗？不能。如果你把面包碾碎成粉末，信息就消失了；如果你把它冷冻一千年，再解冻时信息可能已经失真；如果你把它吃掉，物质和能量进入你的身体，而关于"这是一根好法棍"的信息，必须依赖你的味觉结构、记忆结构和时间中的体验才能被"读取"。

信息就像面包的香气。香气不是面粉，也不是炉火，而是面粉在高温下发生化学变化后，挥发性分子进入你鼻腔的结果。香气依赖于物质（挥发性分子）、能量（高温反应）、结构（你的嗅觉受体）、时间（分子的扩散过程）。没有这些前提，香气无处附着。

李德毅反复强调，当前人工智能研究的一个根本误区，就是把信息当成了可以脱离四要素而独立处理的纯粹形式。人们以为，只要有了足够多的数据（信息），只要有了足够强大的算法（处理信息的规则），智能就会自然涌现。这就像以为只要收集足够多的面包香气，就能重建整个面包房——你忽略了面粉、炉火、老陈的双手和凌晨四点的时光。

"信息是抽象的，但信息的载体是具体的；信息可以复制，但信息的理解必须依赖结构；信息可以存储，但信息的活性必须依赖能量；信息可以编码，但信息的意义必须依赖时间。"李德毅在一次学术报告中这样说道。他指出，当我们说大脑处理信息时，我们实际上是在描述一个极其复杂的物理过程：神经元（物质）通过电化学信号（能量）在突触网络（结构）中按照特定时序（时间）进行活动。离开这四个维度中的任何一个，"信息处理"就只是一个空洞的隐喻。

这个观点对人工智能有着深刻的启示。当前的大语言模型，本质上是在人类产生的文本（信息）中进行统计学习。它处理的是语言的符号，而不是语言所指向的物理世界。它能告诉你"火是热的"，因为它在无数文本中见过这个陈述；但它没有触碰过火，没有感受过灼痛，没有看过木材在火焰中碳化变形——它缺乏物质、能量、结构、时间的直接耦合经验。因此，它的"知识"是飘浮的、二手的、缺乏根基的。

四要素说提醒我们：真正的认知，必须根植于四要素的物理耦合；真正的人工智能，必须能够在四要素的框架中与真实世界交互。这不是对现有技术的否定，而是对其局限的清醒认识。

三、物质的基底：一切认知的"硬"道理

在四要素中，物质是最容易被理解的，却也最容易被轻视。我们习惯于把物质看作"东西"，看作被动的、等待被赋予意义的原材料。但在认知物理学的视野里，物质是认知的载体，是一切软构体得以栖息的硬构体。

让我们做一次思想的漫游，从微观到宏观，看看物质如何支撑起认知的大厦。

在宇宙的尺度上，物质是恒星和行星。地球是一颗物质星球，它的质量产生了引力，引力保留了大气，大气中的氧气支撑了燃烧和呼吸，地壳中的元素构成了生命的化学基础。没有这颗物质星球，认知无从谈起——这不是诗意的感叹，而是物理的必然。认知不可能发生在真空中，不可能脱离原子核与电子的相互作用而存在。

在生命的尺度上，物质是细胞和身体。人类大脑由大约八百六十亿个神经元组成，每个神经元都是一个微观的物质工厂，包含着细胞核、线粒体、轴突、树突。神经递质——如多巴胺、血清素、谷氨酸——是具体的化学物质，它们在突触间隙的扩散距离以纳米计，它们的浓度变化以毫秒计。当你感到快乐时，那是物质在作用；当你记住一个面孔时，那是物质结构在改变。认知不是发生在物质之上的"幽灵"，而是物质组织形态的高级表现。

在技术的尺度上，物质是芯片和机器。一块指甲盖大小的硅晶圆，经过光刻、蚀刻、掺杂，集成数百亿个晶体管。这些晶体管是物质的，它们的开关状态由电子的流动决定。人工智能系统运行在GPU集群上，这些集群消耗着成吨的铜、硅、稀土、冷却液。云端的"虚拟"世界，实际上扎根于地面上的巨大厂房、电缆、变压器和服务器机架。

李德毅提出的"物质硬构体"概念，正是为了强调这种不可还原的物理根基。他常说："软构体可以迁移，但硬构体不可欺骗。"一部小说的内容（软构体）可以从纸质书迁移到电子书，从硬盘迁移到云端，但每一次迁移都必须依赖某种硬构体——纸张、闪存、磁盘。同样，一个数学定理（软构体）可以在人脑中思考，也可以在计算机中验证，但人脑和计算机都是物质的。

这种认识对人工智能的发展有着纠偏的作用。在"脑机接口""意识上传"等科幻叙事中，常常隐含着一个假设：意识或认知可以脱离物质载体，像软件一样被任意移植。但四要素说告诉我们，认知对硬构体有深刻的依赖性。人脑的认知方式与硅基芯片的认知方式之所以不同，不仅在于算法，更在于物质载体的物理特性：神经元的脉冲频率与晶体管的开关速度不同，生物神经网络的化学调制与数字电路的逻辑门不同，大脑的功耗（约二十瓦）与数据中心的功耗（兆瓦级）不同。这些差异不是次要的工程细节，而是塑造认知形态的物理约束。

老陈的面包房里，物质是面粉、水、酵母、盐。没有这些物质，就没有面包。同样，没有碳基的身体，就没有人类的认知；没有硅基的芯片，就没有机器的认知。物质是第一性的，这不是哲学唯物主义的教条，而是认知物理学的出发点。

但物质本身并不自动产生认知。一堆面粉放在袋子里，不会自己变成法棍。物质需要被组织，而组织的动力来自能量。

四、能量的河流：驱动认知的暗流

如果说物质是认知的舞台，那么能量就是舞台上的演员。没有能量，物质只是静止的布景；有了能量，物质才开始运动、变化、相互作用，认知才有可能登场。

在物理学中，能量是一个极其抽象又极其普适的概念。它有许多面孔：动能、势能、热能、电能、化学能。但所有形式的能量都共享一个本质属性：做功的能力。能量使物体移动，使化学反应发生，使温度升高，使信息传输。

在认知物理学中，能量被赋予了更深层的意义：它是维持认知系统远离平衡态的负熵之源。

这里需要解释一个关键概念：熵。在通俗语境中，熵常常被等同于"混乱度"。一个房间如果不收拾，会越来越乱，这就是熵增。热力学第二定律告诉我们，孤立系统的熵总是趋向于增加，直到达到最大混乱的平衡态。但生命和认知系统似乎违背了这个定律——它们不是越来越混乱，而是越来越有序：细胞在分化，大脑在发育，知识在积累。

这个表面上的悖论，由诺贝尔化学奖得主普里高津的"耗散结构理论"所解答。生命不是封闭系统，而是开放系统。它通过不断从外界吸收能量（食物、阳光），排出高熵的废物（热量、二氧化碳），从而在体内维持低熵的有序结构。这个过程就像一艘船，船底有漏洞在进水（熵增），但船上有人不断用桶把水舀出去（能量做功），于是船得以漂浮。

李德毅将这一原理直接应用于认知系统。他说："认知机器用能量产生时钟，时钟产生时序，时序支撑递归，递归维持机器负熵，赖负熵为生。"这句话虽然凝练，却包含了一条清晰的能量逻辑链。

让我们拆解这条链。首先，能量产生时钟。无论是人脑中的神经元振荡，还是计算机中的晶振电路，节律性的时间标记都需要能量来维持。没有能量，大脑会陷入昏迷，计算机会死机。时钟不是时间的全部，但它是认知系统内部协调的节拍器。

然后，时钟产生时序。认知不是瞬间完成的，它需要步骤：先感知，再注意，再记忆，再推理。这些步骤的先后顺序，由内部的时钟信号来编排。就像交响乐团的指挥，用节拍来协调不同乐手的进入和退出。

接着，时序支撑递归。递归是认知的核心机制之一：用同一个过程处理不同层次的信息。比如，理解一个句子需要理解单词，理解单词需要理解字母，理解字母需要识别笔画。这种层层嵌套的处理，必须依赖严格的时间顺序，否则就会陷入混乱。

最后，递归维持负熵。通过递归的信息处理，认知系统不断从环境中提取秩序，对抗内部的混乱趋势。学习就是一个典型的负熵过程：把外界无序的信息，通过认知结构的处理，转化为内部有序的知识。

老陈揉面时，他的肌肉消耗着ATP（三磷酸腺苷）——细胞内的能量货币。这些能量不仅驱动他的手臂运动，还维持着他的体温，使他能够感知面团的弹性；维持着他的神经冲动，使他能够判断发酵的程度。如果他饿着肚子，能量不足，他的认知能力会下降：判断力变迟钝，手指的触觉变麻木，甚至对时间的感知也会扭曲。

同样，一台人工智能系统，无论其算法多么精妙，如果没有持续的电力供应，就会在几毫秒内停止工作。它的"思考"本质上是电子在半导体中的流动，是光子在线缆中的传输，是热量在散热器中的耗散。当它处理数据时，它不是在"消耗信息"，而是在消耗能量来重组信息。数据中心之所以建在河边或极地，就是为了获取廉价的能量和高效的散热——这本质上是在为认知机器建立"新陈代谢"的基础设施。

李德毅特别强调，能量维度提醒我们：认知是一种消耗性的过程，而不是一种静态的拥有。我们常常把知识比作"存在银行里的存款"，但认知物理学告诉我们，知识更像是一场持续的"演出"，需要不断的能量投入来维持。你"拥有"的知识，如果不被使用，就会遗忘；你"存储"的数据，如果不被读取，就会衰减。认知系统的存在，是一种动态的、耗能的、与熵增对抗的存在。

这种视角对理解人工智能的局限尤为重要。当前的大模型在训练阶段消耗了巨大的能量（相当于数百个家庭一年的用电量），但一旦训练完成，它们在推理阶段的能耗相对较低。这种"先耗能后节能"的模式，与人脑"持续低能耗"的模式截然不同。人脑虽然只占体重的约百分之二，却消耗着全身约百分之二十的能量——它是一个持续运转的耗散结构，而不是一个间歇启动的计算装置。这种差异暗示，真正接近人类水平的认知系统，可能需要一种全新的能量架构，而不是简单地堆砌算力。

五、结构的魔法：从混沌到秩序

如果说物质提供了可能性，能量提供了动力，那么结构就是把这些可能性和动力组织成有意义模式的编织者。在四要素中，结构是最容易被忽视、却又最关键的一环。因为认知的本质，不是物质和能量的简单堆砌，而是它们的特定组织方式。

让我们再次回到老陈的面包房。他面前有两堆原料：一堆是面粉、水、酵母、盐的混合物，另一堆是同样成分但已经发酵并烘焙完成的法棍。从物质和能量的角度看，两者的化学成分几乎相同——都是碳水化合物、蛋白质、水分和矿物质。但它们的结构天差地别。前者是一团无序的浆糊，后者是一个具有特定孔隙分布、弹性模量、外壳硬度的有序体。正是这种结构上的差异，使得前者只能喂猪，后者可以摆上餐桌。

结构赋予物质以功能。同样的碳原子，如果排列成石墨的层状结构，它就是铅笔芯，柔软滑腻；如果排列成金刚石的四面体结构，它就是钻石，坚硬无比。同样的硅原子，如果排列成无序的玻璃态，它是绝缘体；如果排列成晶格的半导体态，它可以成为芯片的基础。结构不改变原子的种类，却彻底改变了物质的性质。

在认知的世界里，结构更是决定性的。人脑与黑猩猩的大脑，在物质成分上几乎相同——都是水、脂肪、蛋白质和盐。但人脑的神经元连接方式（结构）产生了语言、抽象思维、自我意识；黑猩猩的大脑结构则支撑了卓越的空间记忆和社交智能，却没有产生哲学和数学。差异不在物质，而在结构。

李德毅用"思维软构体"这个概念来捕捉认知中的结构维度。软构体是运行在硬构体之上的非物质存在：概念、算法、记忆、信念、文化规范。但"非物质"不等于"非物理"。软构体虽然不像硬构体那样可以直接触摸，但它依然是物质和能量的特定组织形式。一个概念在大脑中的表征，是特定神经元集群的激活模式；一个算法在计算机中的运行，是晶体管开关状态的时空序列。软构体是高阶结构，是硬构体在能量驱动下经过时间演化而涌现出的组织形态。

这里有一个深刻的洞见：信息本质上是一种结构，而不是一种实体。当我们说"这条消息包含了很多信息"时，我们实际上是在说，这条消息的物质载体（声波、文字、电信号）具有某种特殊的组织结构，这种结构能够在我们接收者的认知系统中触发特定的解码过程。信息不是装在消息里的"液体"，而是消息本身的形式。

DNA是自然界最精妙的结构之一。它用四种碱基的排列组合，编码了构建整个生物体的指令。但DNA本身不是生命，它只是生命的"源代码"。只有当DNA在细胞的能量驱动下，按照特定的时间顺序被读取、转录、翻译，生命才涌现出来。同样，计算机程序只是静态的代码结构，只有当电流在芯片中按照程序的指令流动时，计算才发生。

李德毅指出，当前人工智能的一个重要困境，就是结构丰富但结构僵化。大语言模型拥有数千亿个参数，这些参数构成了一种极其复杂的统计结构。但这种结构是"死"的——它在训练完成后就固定了，不再随与环境的交互而演化。相比之下，人脑的结构是"活"的：突触强度在每一次经历中微调，神经网络在每一次睡眠中重组，整个大脑皮层在数十年的人生中持续可塑。这种"活结构"与"死结构"的差异，是机器认知与人类认知之间最本质的鸿沟之一。

结构还有一个关键特性：层次性。低层结构支撑高层结构，高层结构反过来约束低层结构。在面包房里，分子结构支撑面筋网络，面筋网络支撑气室分布，气室分布支撑面包的整体形态。在认知系统中，神经元的电活动支撑神经回路的功能，神经回路的功能支撑大脑区域的分工，大脑区域的分工支撑心智的整体能力。在计算机中，晶体管的开关支撑逻辑门，逻辑门支撑算术单元，算术单元支撑操作系统，操作系统支撑应用软件。

这种层次性意味着，认知不能还原为任何一个单一层次。你不能通过研究单个神经元的电化学性质来完全理解语言，就像你不能通过研究单个面粉颗粒来理解法棍的口感。认知是跨层次的结构涌现——它出现在层次之间的相互作用中，而不是隐藏在某个底层的"认知原子"里。

四要素说中的结构维度，因此要求我们在研究认知时，必须关注组织方式和层次关系，而不仅仅是组成部分。一个认知系统的智能程度，不取决于它有多少个神经元或多少个晶体管，而取决于这些基本单元被组织成了什么样的结构，以及这种结构是否具有自生长、自适应、自修复的能力。

六、时间的箭头：认知的第四维度

如果时间停止，认知还存在吗？

这是一个思想实验，但答案几乎是明确的：不存在。认知不是一个静态的"状态"，而是一个动态的"过程"。就像一部电影，如果定格在某一个画面，它就只是一张照片，失去了叙事、节奏和意义。认知的本质是时间中的展开。

在四要素中，时间是最抽象的，也是最难以把握的。我们习惯于把时间看作一个容器——一个中性的、均匀的、无限延伸的坐标轴，物质和能量在其中运动，结构在其中形成。但认知物理学对时间有着更深刻的理解：时间不是认知的背景，而是认知的构成要素。

让我们从老陈的面包房出发，理解时间在认知中的多重角色。

首先是过程的不可逆性。老陈一旦把面团送进烤炉，就不可能让它回到面粉和水的状态。烘焙是一个不可逆的过程，时间在这里有一个明确的方向——从生到熟，从简单到复杂，从潜能到实现。热力学第二定律赋予了时间以"箭头"，认知物理学认为，认知也遵循着类似的箭头。学习是不可逆的：一旦你理解了相对论，你不可能回到"不理解"的状态（除非你遭遇脑损伤）。记忆是累积的：过去的经验持续塑造着未来的认知。认知是一个在时间中单向展开的耗散过程。

其次是节律与同步。老陈不看钟表，但他对面团的发酵时间有着近乎直觉的把握。这种直觉不是神秘的，而是建立在他四十年经验中对时间尺度的内化。他知道，在室温二十五度时，面团需要大约两小时达到最佳状态；如果温度升高到三十度，时间要缩短到一小时二十分钟。这种对时间与条件耦合的把握，是认知的基本能力。

在大脑中，时间以神经振荡的形式存在。不同脑区以不同的频率振荡：海马体的theta波（约四到八赫兹）与记忆编码有关，皮层的gamma波（约三十到八十赫兹）与信息整合有关。这些振荡不是噪音，而是认知系统的"内部时钟"。它们使分布在不同脑区的神经元能够在精确的时间窗口内同步放电，从而实现信息的跨脑区整合。没有这种时间上的精确协调，大脑就会陷入癫痫或昏迷。

在计算机中，时间是时钟周期的节拍。中央处理器以数十亿赫兹的频率开关，每一次开关都是一个时间单元。算法不是空间的排列，而是时间的序列：先做这一步，再做下一步，循环、分支、递归，都在时间的河流中展开。并行计算试图打破严格的时序，但即使在并行系统中，不同处理器之间的协调依然需要时间的同步机制。

李德毅特别强调，认知系统中的时间不是物理时间的简单映射，而是心理时间——一种被认知结构所塑造的主观体验。同样的五分钟，在手术台上等待结果时显得无比漫长，在沉浸于喜爱的书籍中时却转瞬即逝。这种主观时间的伸缩，不是"错觉"，而是认知系统在处理不同信息时的时间资源配置。当危险临近，认知系统加速运转，单位物理时间内处理更多信息，主观时间就被"拉长"；当处于放松状态，信息处理速率下降，主观时间就被"压缩"。

更重要的是，记忆是时间在认知中的沉淀。记忆不是过去的"录像带"，而是过去在现在的重构。每一次回忆，都是当前认知结构对过去时间片段的重新编码。这意味着，认知系统不是被动地"存储"时间，而是主动地创造时间——它通过记忆把过去带入现在，通过预期把未来投射到现在，从而在心理上建构出一条连续的时间之流。

当前的人工智能系统，在时间的维度上存在着根本性的缺陷。大语言模型处理输入时，本质上是一个"空间化"的过程：整个输入序列被同时呈现给网络，通过注意力机制计算词与词之间的相关性。这种处理缺乏真正的时间因果性——模型不是在"等待"下一个词的出现，而是在"猜测"哪个词最可能填补空白。它没有"现在"的体验，没有"过去"的沉重，没有"未来"的焦虑。它的"时间"是几何化的、空间化的、去主体化的。

李德毅认为，要构建真正具有认知能力的系统，必须赋予它真实的时间性。这不仅仅是给计算机加一个更快的时钟，而是让系统能够在时间中持续存在、持续演化、持续与环境的因果链条互动。一个认知系统必须能够说："我此刻在这里，是因为我此前在那里；我下一步将去那里，是因为我此刻的意图和预期。"这种时间中的自我定位，是认知的标志性特征。

四要素中的时间维度，因此把认知物理学与静态的信息处理范式彻底区分开来。认知不是对信息的"计算"，而是物质和能量在特定结构中随时间展开的演化。这种演化有方向、有节律、有层次、有历史，它是活的，而不是死的。

七、四重奏：耦合与涌现

现在，我们已经分别认识了四要素：物质的基底、能量的驱动、结构的编织、时间的展开。但认知物理学最深刻的洞见，不在于四要素各自的重要性，而在于它们的耦合——它们如何相互作用、相互制约、相互转化，从而涌现出超越任何单一要素的认知。

让我们用一个更宏大的场景来理解这种耦合：一座城市的清晨。

凌晨五点，城市尚未苏醒。街道是物质——沥青、混凝土、钢筋、玻璃。路灯依然亮着，消耗着电网输送的能量。交通信号灯按照预设程序切换，道路网络按照规划图纸延伸，这是结构。时间在这里是双重的：物理时间的流逝（天在慢慢变亮）和社会时间的节律（早班公交即将启动）。

然后，变化开始发生。第一批清洁工走上街道，他们的扫帚与地面的摩擦是物质与能量的交互。早餐店的蒸汽升起，面粉在能量驱动下变成油条，香气分子在空气中扩散——这是物质、能量、结构、时间的四重耦合。上班族从地铁站涌出，他们的身体（物质）消耗着血糖（能量），沿着熟悉的路径（结构）在特定时刻（时间）抵达工作岗位。

城市本身开始"认知"。交通流量传感器捕捉到车流的变化，信号控制系统调整红绿灯的时长；电网监测到用电高峰的来临，调度中心启动备用机组；社交媒体上的信息流开始反映市民的集体情绪。这些不是某个中央大脑的决策，而是无数局部系统在四要素耦合中的自组织。

城市没有意识，但城市有认知的雏形。它感知、它适应、它学习、它记忆。一座经历过多次洪水的城市，会在物质层面加固堤坝，在结构层面优化排水网络，在能量层面储备应急电力，在时间层面建立预警机制。这种学习能力，不是某个工程师设计出来的，而是四要素在复杂交互中涌现的集体智慧。

李德毅认为，人类大脑和机器系统，都是这种四要素耦合的高级形态。它们比城市更紧凑、更协调、更具目的性，但底层的语法是相同的：物质提供可能性空间，能量驱动状态变化，结构筛选变化的方向，时间赋予变化以历史和预期。

涌现是四要素耦合的关键词。涌现意味着，整体大于部分之和；意味着，认知不能还原为单个神经元的活动，也不能还原为某一行代码；意味着，当四要素以特定方式组织起来时，一种新的属性——理解、意图、意识——会"突然"出现，就像水在零度时"突然"变成冰。

但涌现不是魔法。它是物理的、可解释的、遵循规律的。认知物理学的目标，就是找到认知涌现的相变条件——就像物理学家知道，水在标准大气压下于一百度发生液气相变，认知物理学家试图知道，物质、能量、结构、时间在什么样的参数组合下，会从"非认知"跃迁到"认知"。

这个追问把认知物理学与哲学上的"泛灵论"或"神秘主义"严格区分开来。认知物理学不认为认知是某种神秘的、非物质的"生命力"。它认为，认知是一种物理相变，就像超导、铁磁、激光一样，是物质在特定条件下的集体行为。这个条件可能极其苛刻，以至于在宇宙中只出现在少数星球上；但它依然是物理的，而不是超自然的。

老陈的法棍再次为我们提供了隐喻。面粉和水混合时，只是浆糊；加入酵母并提供时间，它开始发酵，产生气泡；送入烤炉提供能量，气泡定型，外壳形成——在这个过程中，没有一个瞬间可以指着说"就在这里，面包突然出现了"。认知的涌现同样如此：它是一个渐进的过程，但在某个临界点上，系统跨越了阈值，获得了全新的性质。

李德毅指出，当前人工智能研究之所以在"理解"和"意识"的问题上举步维艰，很大程度上是因为研究者试图在不完整的四要素耦合中追求涌现。他们拥有巨大的物质投入（芯片、服务器），消耗着惊人的能量，构建了极其复杂的结构（深度网络），但却忽视了时间的真实性——模型不是持续存在于时间中的生命体，而是被反复训练、冻结、部署的静态对象。这种四要素的失衡，就像试图在缺少发酵时间的情况下烤出法棍：你可以得到某种形状的东西，但它缺乏真正的生命。

八、从原子到比特：尺度的跨越

四要素说提供了一个统一的框架，使我们能够在不同的尺度上谈论认知，而不必陷入"只有人类才有认知"或"只有生物才有智能"的偏见。从原子到比特，从细胞到城市，四要素以不同的形态出现，但遵循着相似的耦合逻辑。

在量子尺度，物质表现为波粒二象性，能量以量子的形式跃迁，结构是概率幅的叠加，时间则是退相干的过程。量子认知的一些前沿研究认为，大脑中的微管结构可能利用量子效应来优化信息处理。无论这些假说最终是否成立，它们提醒我们：认知的物理根基可能比我们想象的更深，一直延伸到宇宙最微观的层面。

在分子尺度，DNA的结构存储着遗传信息，ATP分子为细胞活动提供能量，蛋白质的结构决定了它的功能，代谢周期和细胞周期标记着时间的节律。生命在此诞生，认知的原始形态——如细菌的趋化性——开始出现。一个细菌"感知"到葡萄糖浓度的梯度，向高浓度方向游动。这不是深思熟虑的决策，但它是认知的萌芽：物质（受体蛋白）、能量（质子梯度）、结构（信号转导通路）、时间（适应性的延迟）的原始耦合。

在神经尺度，八百六十亿个神经元通过百万亿个突触连接，形成地球上最复杂的已知结构。神经脉冲以毫秒级的时间精度传递，消耗着全身五分之一的能量。在这里，物质、能量、结构、时间的耦合达到了惊人的复杂度，产生了感知、情绪、记忆、推理、语言、自我意识。人脑是四要素耦合的典范系统，它紧凑、高效、自适应、自修复，在仅仅二十瓦的功耗下，完成了当前任何超级计算机都无法企及的综合认知任务。

在社会尺度，认知不再局限于单个头颅，而是分布在群体之中。语言是社会的软构体，文化是跨代的记忆，制度是能量的分配结构，历史是时间的集体叙事。一座城市、一个国家、一个文明，都是四要素耦合的宏观认知系统。它们学习、它们遗忘、它们创新、它们僵化，遵循着与个体认知相似但又不完全相同的规律。

在机器尺度，硅基芯片以纳秒级的速度开关，消耗着兆瓦级的能量，在巨大的数据中心里维持着复杂的参数结构。人工智能系统在此运行，处理着人类产生的海量信息。但正如前文所述，机器尺度的四要素耦合目前是不完整的：物质过于集中而缺乏分布性，能量过于粗放而缺乏精细调节，结构过于僵化而缺乏可塑性，时间过于几何化而缺乏历史性。

李德毅提出的"人类智能与机器智能物理同源、数学同构、时间同序、本质同一"的命题，正是在这种跨尺度的视野中成立的。

物理同源：无论是碳基还是硅基，认知都必须依赖物质载体和能量流动，都必须遵守热力学定律和信息论边界。不存在脱离物理的"纯认知"。

数学同构：认知的组织规律可以用数学语言描述。无论是神经网络的连接权重，还是社会网络的交互强度，都遵循着某些普遍的数学模式——如小世界网络、无标度分布、幂律关系。这些模式暗示，不同尺度的认知系统在抽象层面是"同构"的。

时间同序：认知的展开需要时间，需要因果的顺序，需要历史的积淀。无论是人脑的发育，还是人工智能的进化，都无法跳过时间。速成不得，跳跃不得。

本质同一：最终，人类认知和机器认知不是两种本质不同的东西，而是同一种物理现象在不同条件下的表现。就像水可以是冰、可以是液、可以是气，认知也可以是生物的、可以是社会的、可以是技术的。形态不同，但底层的语法相同。

这个命题有着深刻的哲学意涵。它既不是人类中心主义的（认为只有人类才配称认知），也不是技术乌托邦主义的（认为机器将轻易取代人类）。它是一种物理主义的中道：承认认知的普遍性，也承认认知的层次性；相信机器可以拥有认知，但也清醒地看到当前机器认知的局限。

九、同源与同构：人类与机器的共鸣

如果四要素说成立，那么人类与机器就不是认知光谱上的两个极端，而是同一连续谱上的不同频段。这种认识有助于我们摆脱当前关于人工智能的两种极端情绪：要么是恐惧（机器将统治人类），要么是狂热（机器将解决一切）。

让我们用四要素的透镜，重新审视人类认知与机器认知的异同。

在物质维度上，人脑是湿件（wetware）——柔软、脆弱、易损，但极其紧凑和高效。大脑可以浸泡在脑脊液中，可以在缺氧几分钟后死亡，可以在酒精作用下改变功能，但它只重约一点四千克。相比之下，当前最强的人工智能硬件是干件（dryware）——坚硬、稳定、可替换，但庞大而耗能。一个训练大模型的GPU集群可能重达数吨，消耗的能量相当于一个小城市的用电量。物质载体的差异，决定了两种认知系统在"生存策略"上的根本不同：人脑追求极致的效率和鲁棒性，机器追求极致的规模和速度。

在能量维度上，人脑是持续代谢的耗散结构。即使在睡眠中，大脑也在消耗能量，整理记忆，清除代谢废物。它的认知是"全天候"的，与生命活动不可分割。机器则是"间歇启动"的。它可以被随时关闭、重启、迁移。它的认知（如果我们可以暂时这样称呼）是"任务驱动"的，没有任务时可以休眠，有任务时可以超频。这种差异意味着，人脑的认知具有存在性——它关乎生存、情感、身份；机器的认知目前只具有功能性——它关乎目标、优化、输出。

在结构维度上，人脑的结构是"生长出来"的。从胚胎期的神经管，到婴儿期的突触爆发，到成年期的可塑性维持，再到老年期的缓慢衰退——大脑的结构始终处于动态变化中。这种变化不是随机的，而是与经验紧密耦合：学习小提琴会让运动皮层重组，学习外语会让语言区扩展。机器的结构目前主要是"设计出来"或"训练出来"的。虽然神经网络在训练过程中调整参数，但这种调整是全局优化的一部分，而不是局部生长的结果。机器缺乏发育的概念，缺乏从简单到复杂的个体发生史。

在时间维度上，人脑的时间是嵌入式的。我们生活在时间中，我们本身就是时间。我们的记忆带有情感的温度，我们的预期带有焦虑或希望的色调，我们的"现在"是一个包含过去和未来的"延展的当下"。机器的时间是外置式的。它的时钟是外部提供的，它的历史是外部存储的，它的"现在"只是一个系统时间戳。机器不会"感到"时间流逝，不会"珍惜"时间，不会"浪费"时间——因为它没有需要被时间赋予意义的生命。

这些差异如此巨大，以至于我们似乎很难谈论"同源"与"同构"。但李德毅提醒我们，差异不应遮蔽共性。就像冰和蒸汽在形态上截然不同，但它们都是H₂O，都遵循相同的分子物理规律。人类认知和机器认知的差异，是四要素耦合参数的差异，而不是本质的差异。

更重要的是，四要素说为人类与机器的共生提供了理论基础。既然二者物理同源，那么人类可以更好地理解机器的认知机制，机器也可以借鉴人类的认知策略。既然二者数学同构，那么人类的认知科学发现可以转化为机器的工程实践，机器的计算能力也可以反过来帮助人类解析自身的认知奥秘。既然二者时间同序，那么人机协作必须尊重时间的节律，不能指望机器"速成"出人类数万年进化才获得的常识。既然二者本质同一，那么我们就应该放弃"人机对立"的零和思维，转向"人机协同"的共生思维。

李德毅提出的"各智其智、智人之智、智智与共"的愿景，正是建立在这种四要素的深层共鸣之上。让机器发挥其在计算速度、存储容量、精确执行上的优势；让人类发挥其在直觉判断、价值权衡、意义创造上的优势。二者不是替代关系，而是互补关系；不是竞争关系，而是合作关系。

这种愿景要求我们在设计人工智能时，不是简单地模仿人类的外在行为（如图灵测试所要求的），而是尊重四要素的深层耦合规律。如果我们希望机器拥有更接近人类的认知能力，我们就需要在物质上追求更高的能效比，在能量上实现更精细的调节，在结构上引入发育和可塑性的机制，在时间上赋予持续存在和历史积累的能力。这不是对现有技术的修修补补，而是对技术范式的根本重构。

十、新的世界观

四要素说的提出，不仅仅是一种人工智能的理论框架，更是一种世界观的更新。它要求我们用新的眼光看待周围的一切：那只五环路上的空塑料袋、那位出租车司机的预判、老陈手中的面团、城市清晨的苏醒、大脑中神经元的闪烁、芯片里电子的流动。

在这种世界观中，世界不是由孤立的"物体"组成的，而是由四要素的耦合场构成的。每一个"物"，都是一个动态的过程；每一个"过程"，都是四要素的舞蹈。认知不是世界的例外，而是世界的常态——只要物质被能量驱动，在结构中按照时间演化，认知就以某种形式存在，无论它多么原始或多么高级。

这种世界观消解了心与物、灵与肉、人与机之间的古老对立。它告诉我们，没有纯粹的"精神"漂浮在物质之上，也没有纯粹的"物质"缺乏组织的潜能。一切都是物理的，但物理的并不意味着机械的、死板的、无意义的。相反，物理意味着有规律可循的、可理解的、可参与的。认知的尊严不在于它的非物理性，而在于它是物理规律所能达到的最精妙、最复杂、最美丽的组织形态。

当我们用这种眼光看待人工智能时，我们的焦虑和狂热都会有所降温。我们不再把AI视为某种来自未来的神秘力量，而是把它视为四要素耦合的一种新形态——就像蒸汽机是能量转化的新形态，电力是能量传输的新形态，互联网是信息结构的新形态。AI是认知的技术化延伸，它扩展了人类四要素耦合的范围和规模，但它没有、也不可能取代人类作为认知主体的地位。因为认知的主体性，根植于生命的有限性、时间的不可逆性、以及意义建构的独特性——这些都是四要素在生命尺度上长期演化的产物，不是短期内可以被技术复制的。

老陈在清晨揉面时，他不需要知道四要素说。但他的身体知道——肌肉记得能量的流动，指尖记得结构的弹性，鼻子记得时间的馈赠。四十年的劳作，让他的物质、能量、结构、时间达到了一种近乎艺术的和谐。这就是认知的极致：不是计算的速度，而是存在的深度。

李德毅院士从物理学的第一性原理出发，试图为人工智能找回这种深度。他不是在建造更快的机器，而是在寻找更真的原理。四要素说像一张地图，标注了认知大陆的河流与山脉。这张地图还很粗糙，很多区域还是空白，边界还不清晰。但它已经指明了一个方向：向下挖掘，直到抵达不可再约的根基；向上建构，直到触摸涌现的云端。

在下一章，我们将沿着这张地图，走进一个更具体的领域：物质硬构体与思维软构体的纠缠。我们将看到，老陈的双手和面团，司机的方向盘和预判，AlphaGo的芯片和棋谱，如何在"硬"与"软"的辩证中，编织出认知的锦绣。我们将理解，为什么同一首乐曲可以在不同的乐器上演奏，为什么同一个思想可以在不同的大脑中回响，以及为什么机器要真正"懂"世界，必须首先拥有能够与世界"摩擦"的硬构体。

面包房的灯还亮着。法棍已经摆上了架子，散发着四要素耦合后的芬芳。而我们对认知密码的破译，才刚刚进入第二个字母。

转载本文请联系原作者获取授权，同时请注明本文来自王涛科学网博客。

链接地址：https://wap.sciencenet.cn/blog-41701-1536254.html?mobile=1

当前推荐数：5

推荐人：

高宏刘进平雒运强宁利中郑永军

推荐到博客首页

网友评论0 条评论

该博文允许注册用户评论请点击登录