第三章 四要素:物质、能量、结构、时间的宇宙密码
一、面包房里的第一性原理
凌晨四点,城市还在沉睡,街角那家开了三十年的面包房已经亮起暖黄的灯。老师傅姓陈,大家都叫他老陈。他今年六十二岁,揉了四十年的面。此刻,他正站在那张被面粉染成灰白色的橡木案板前,准备做今天的第一炉法棍。
他的动作像一场古老的仪式。先从面缸里舀出精磨的高筋面粉——这是物质,是这一切的基底,是碳、氢、氧、氮原子在特定比例下的聚合。面粉落在案板上,扬起一阵细腻的白色烟雾,在灯光里缓缓沉降。然后倒入水,激活那些沉睡的蛋白质。老陈的手插进面团,开始揉压。他的双臂肌肉收缩,消耗着早餐转化的糖原——这是能量,是驱动这场转化的动力,是使面粉和水从分离走向融合的推手。
但仅有面粉、水和能量,还不足以成就一根法棍。老陈知道,面团需要静置,需要发酵。酵母菌在温暖的面团内部悄然工作,释放出二氧化碳,在面筋网络中形成无数微小的气室。这些气室的分布不是随机的,它们遵循着某种隐秘的组织规律——这是结构。面筋蛋白像无数微小的弹簧,相互缠绕、交联,形成一个弹性的三维网络。没有这个网络,气体就会逃逸,面团只会变成一块死面饼,而不是蓬松的面包。
最后,是时间。老陈从不看钟表,他看面团。手指轻按,观察回弹的速度;凑近嗅闻,捕捉酸度的微妙变化。发酵不足,面包会紧实如砖;发酵过度,面筋会塌陷如泥。时间在这里不是钟表上的刻度,而是物质在能量驱动下发生结构演化的过程本身。当面团被送进烤炉,热量在二十分钟内重新组织水分子的运动,美拉德反应在表面编织出金黄的外壳,气室在高温中定型——物质、能量、结构、时间,在这一刻完成了一场四重奏。
老陈不懂什么高深的物理学,但他用四十年的身体经验,内化了这套法则。当他把新鲜出炉的法棍摆在木架上,面包散发着麦香,外壳轻敲有声,内部蜂窝均匀——这就是四要素完美耦合的见证。
李德毅院士在提出认知物理学时,曾多次用类似的日常场景向听众解释他的"四要素说"。他说,人类最容易忽视的真理,往往藏在最平凡的劳作里。一根法棍的诞生,与一颗恒星的燃烧,与一个生命的成长,与一次认知的发生,在深层结构上共享着同一套语法。这套语法,就是物质、能量、结构、时间——李德毅将其视为统揽人的认知和机器认知的第一性原理。
什么是第一性原理?它不是从其他原理推导出来的次级规则,而是整个理论体系不可再约的根基。就像欧几里得几何的五条公设,就像牛顿力学中的惯性定律,就像热力学中的能量守恒——它们不能被证明,只能被假定,但整个宏伟的理论大厦都建立在其上。李德毅认为,认知科学和人工智能研究了几十年,积累了无数的技术和算法,却始终缺乏这样的根基。大家像是在没有地基的土地上盖楼,楼越盖越高,却没有人知道它会不会在某一天突然倾斜。
四要素说,就是李德毅为认知科学浇筑的地基。但这个地基的提出,不是为了制造另一套晦涩的术语,而是为了回答一个困扰人类数千年的问题:认知,这种看似最虚无缥缈的精神活动,究竟是如何在沉甸甸的物理世界中诞生的?
二、信息的"第三者"身份
要理解四要素说,我们必须先破除一个根深蒂固的迷思。这个迷思在信息时代被无限放大,甚至成为了一种新的宗教——那就是对"信息"的盲目崇拜。
我们生活在一个言必称"信息"的时代。信息经济、信息社会、信息爆炸、信息处理。人工智能被描述为"信息处理系统",大脑被比喻为"生物计算机",意识被猜测为"信息的某种整合"。在这种叙事里,信息似乎成了一种独立的、本原的存在,与物质和能量并驾齐驱,甚至有人认为信息比物质和能量更基本——"万物源于比特",这是某著名物理学家的名言。
但李德毅提出了一个截然不同的观点:信息不是物质,也不是能量。它是在物质、能量、结构、时间这四要素的特定耦合中涌现的衍生物。
这个论断像一盆冷水,浇在信息崇拜的狂热上。让我们回到老陈的面包房来理解这一点。
当老陈把法棍从烤炉取出时,这根面包包含了大约二百五十克的碳水化合物、蛋白质、脂肪和水分——这是物质。这些物质在烘焙过程中吸收了大约零点三千瓦时的电能——这是能量。但面包里有没有"信息"?当然有。面包的形状、孔隙的分布、外壳的色泽,都携带着信息:它告诉你这是一根法棍,不是一根油条;它告诉你发酵的程度、烘焙的火候、甚至老陈的手艺水平。
但你能把这条信息从面包里"抽离"出来,像抽走一根丝线那样,让它独立存在吗?不能。如果你把面包碾碎成粉末,信息就消失了;如果你把它冷冻一千年,再解冻时信息可能已经失真;如果你把它吃掉,物质和能量进入你的身体,而关于"这是一根好法棍"的信息,必须依赖你的味觉结构、记忆结构和时间中的体验才能被"读取"。
信息就像面包的香气。香气不是面粉,也不是炉火,而是面粉在高温下发生化学变化后,挥发性分子进入你鼻腔的结果。香气依赖于物质(挥发性分子)、能量(高温反应)、结构(你的嗅觉受体)、时间(分子的扩散过程)。没有这些前提,香气无处附着。
李德毅反复强调,当前人工智能研究的一个根本误区,就是把信息当成了可以脱离四要素而独立处理的纯粹形式。人们以为,只要有了足够多的数据(信息),只要有了足够强大的算法(处理信息的规则),智能就会自然涌现。这就像以为只要收集足够多的面包香气,就能重建整个面包房——你忽略了面粉、炉火、老陈的双手和凌晨四点的时光。
"信息是抽象的,但信息的载体是具体的;信息可以复制,但信息的理解必须依赖结构;信息可以存储,但信息的活性必须依赖能量;信息可以编码,但信息的意义必须依赖时间。"李德毅在一次学术报告中这样说道。他指出,当我们说大脑处理信息时,我们实际上是在描述一个极其复杂的物理过程:神经元(物质)通过电化学信号(能量)在突触网络(结构)中按照特定时序(时间)进行活动。离开这四个维度中的任何一个,"信息处理"就只是一个空洞的隐喻。
这个观点对人工智能有着深刻的启示。当前的大语言模型,本质上是在人类产生的文本(信息)中进行统计学习。它处理的是语言的符号,而不是语言所指向的物理世界。它能告诉你"火是热的",因为它在无数文本中见过这个陈述;但它没有触碰过火,没有感受过灼痛,没有看过木材在火焰中碳化变形——它缺乏物质、能量、结构、时间的直接耦合经验。因此,它的"知识"是飘浮的、二手的、缺乏根基的。
四要素说提醒我们:真正的认知,必须根植于四要素的物理耦合;真正的人工智能,必须能够在四要素的框架中与真实世界交互。 这不是对现有技术的否定,而是对其局限的清醒认识。
三、物质的基底:一切认知的"硬"道理
在四要素中,物质是最容易被理解的,却也最容易被轻视。我们习惯于把物质看作"东西",看作被动的、等待被赋予意义的原材料。但在认知物理学的视野里,物质是认知的载体,是一切软构体得以栖息的硬构体。
让我们做一次思想的漫游,从微观到宏观,看看物质如何支撑起认知的大厦。
在宇宙的尺度上,物质是恒星和行星。地球是一颗物质星球,它的质量产生了引力,引力保留了大气,大气中的氧气支撑了燃烧和呼吸,地壳中的元素构成了生命的化学基础。没有这颗物质星球,认知无从谈起——这不是诗意的感叹,而是物理的必然。认知不可能发生在真空中,不可能脱离原子核与电子的相互作用而存在。
在生命的尺度上,物质是细胞和身体。人类大脑由大约八百六十亿个神经元组成,每个神经元都是一个微观的物质工厂,包含着细胞核、线粒体、轴突、树突。神经递质——如多巴胺、血清素、谷氨酸——是具体的化学物质,它们在突触间隙的扩散距离以纳米计,它们的浓度变化以毫秒计。当你感到快乐时,那是物质在作用;当你记住一个面孔时,那是物质结构在改变。认知不是发生在物质之上的"幽灵",而是物质组织形态的高级表现。
在技术的尺度上,物质是芯片和机器。一块指甲盖大小的硅晶圆,经过光刻、蚀刻、掺杂,集成数百亿个晶体管。这些晶体管是物质的,它们的开关状态由电子的流动决定。人工智能系统运行在GPU集群上,这些集群消耗着成吨的铜、硅、稀土、冷却液。云端的"虚拟"世界,实际上扎根于地面上的巨大厂房、电缆、变压器和服务器机架。
李德毅提出的"物质硬构体"概念,正是为了强调这种不可还原的物理根基。他常说:"软构体可以迁移,但硬构体不可欺骗。"一部小说的内容(软构体)可以从纸质书迁移到电子书,从硬盘迁移到云端,但每一次迁移都必须依赖某种硬构体——纸张、闪存、磁盘。同样,一个数学定理(软构体)可以在人脑中思考,也可以在计算机中验证,但人脑和计算机都是物质的。
这种认识对人工智能的发展有着纠偏的作用。在"脑机接口""意识上传"等科幻叙事中,常常隐含着一个假设:意识或认知可以脱离物质载体,像软件一样被任意移植。但四要素说告诉我们,认知对硬构体有深刻的依赖性。人脑的认知方式与硅基芯片的认知方式之所以不同,不仅在于算法,更在于物质载体的物理特性:神经元的脉冲频率与晶体管的开关速度不同,生物神经网络的化学调制与数字电路的逻辑门不同,大脑的功耗(约二十瓦)与数据中心的功耗(兆瓦级)不同。这些差异不是次要的工程细节,而是塑造认知形态的物理约束。
老陈的面包房里,物质是面粉、水、酵母、盐。没有这些物质,就没有面包。同样,没有碳基的身体,就没有人类的认知;没有硅基的芯片,就没有机器的认知。物质是第一性的,这不是哲学唯物主义的教条,而是认知物理学的出发点。
但物质本身并不自动产生认知。一堆面粉放在袋子里,不会自己变成法棍。物质需要被组织,而组织的动力来自能量。
四、能量的河流:驱动认知的暗流
如果说物质是认知的舞台,那么能量就是舞台上的演员。没有能量,物质只是静止的布景;有了能量,物质才开始运动、变化、相互作用,认知才有可能登场。
在物理学中,能量是一个极其抽象又极其普适的概念。它有许多面孔:动能、势能、热能、电能、化学能。但所有形式的能量都共享一个本质属性:做功的能力。能量使物体移动,使化学反应发生,使温度升高,使信息传输。
在认知物理学中,能量被赋予了更深层的意义:它是维持认知系统远离平衡态的负熵之源。
这里需要解释一个关键概念:熵。在通俗语境中,熵常常被等同于"混乱度"。一个房间如果不收拾,会越来越乱,这就是熵增。热力学第二定律告诉我们,孤立系统的熵总是趋向于增加,直到达到最大混乱的平衡态。但生命和认知系统似乎违背了这个定律——它们不是越来越混乱,而是越来越有序:细胞在分化,大脑在发育,知识在积累。
这个表面上的悖论,由诺贝尔化学奖得主普里高津的"耗散结构理论"所解答。生命不是封闭系统,而是开放系统。它通过不断从外界吸收能量(食物、阳光),排出高熵的废物(热量、二氧化碳),从而在体内维持低熵的有序结构。这个过程就像一艘船,船底有漏洞在进水(熵增),但船上有人不断用桶把水舀出去(能量做功),于是船得以漂浮。
李德毅将这一原理直接应用于认知系统。他说:"认知机器用能量产生时钟,时钟产生时序,时序支撑递归,递归维持机器负熵,赖负熵为生。"这句话虽然凝练,却包含了一条清晰的能量逻辑链。
让我们拆解这条链。首先,能量产生时钟。无论是人脑中的神经元振荡,还是计算机中的晶振电路,节律性的时间标记都需要能量来维持。没有能量,大脑会陷入昏迷,计算机会死机。时钟不是时间的全部,但它是认知系统内部协调的节拍器。
然后,时钟产生时序。认知不是瞬间完成的,它需要步骤:先感知,再注意,再记忆,再推理。这些步骤的先后顺序,由内部的时钟信号来编排。就像交响乐团的指挥,用节拍来协调不同乐手的进入和退出。
接着,时序支撑递归。递归是认知的核心机制之一:用同一个过程处理不同层次的信息。比如,理解一个句子需要理解单词,理解单词需要理解字母,理解字母需要识别笔画。这种层层嵌套的处理,必须依赖严格的时间顺序,否则就会陷入混乱。
最后,递归维持负熵。通过递归的信息处理,认知系统不断从环境中提取秩序,对抗内部的混乱趋势。学习就是一个典型的负熵过程:把外界无序的信息,通过认知结构的处理,转化为内部有序的知识。
老陈揉面时,他的肌肉消耗着ATP(三磷酸腺苷)——细胞内的能量货币。这些能量不仅驱动他的手臂运动,还维持着他的体温,使他能够感知面团的弹性;维持着他的神经冲动,使他能够判断发酵的程度。如果他饿着肚子,能量不足,他的认知能力会下降:判断力变迟钝,手指的触觉变麻木,甚至对时间的感知也会扭曲。
同样,一台人工智能系统,无论其算法多么精妙,如果没有持续的电力供应,就会在几毫秒内停止工作。它的"思考"本质上是电子在半导体中的流动,是光子在线缆中的传输,是热量在散热器中的耗散。当它处理数据时,它不是在"消耗信息",而是在消耗能量来重组信息。数据中心之所以建在河边或极地,就是为了获取廉价的能量和高效的散热——这本质上是在为认知机器建立"新陈代谢"的基础设施。
李德毅特别强调,能量维度提醒我们:认知是一种消耗性的过程,而不是一种静态的拥有。 我们常常把知识比作"存在银行里的存款",但认知物理学告诉我们,知识更像是一场持续的"演出",需要不断的能量投入来维持。你"拥有"的知识,如果不被使用,就会遗忘;你"存储"的数据,如果不被读取,就会衰减。认知系统的存在,是一种动态的、耗能的、与熵增对抗的存在。
这种视角对理解人工智能的局限尤为重要。当前的大模型在训练阶段消耗了巨大的能量(相当于数百个家庭一年的用电量),但一旦训练完成,它们在推理阶段的能耗相对较低。这种"先耗能后节能"的模式,与人脑"持续低能耗"的模式截然不同。人脑虽然只占体重的约百分之二,却消耗着全身约百分之二十的能量——它是一个持续运转的耗散结构,而不是一个间歇启动的计算装置。这种差异暗示,真正接近人类水平的认知系统,可能需要一种全新的能量架构,而不是简单地堆砌算力。
五、结构的魔法:从混沌到秩序
如果说物质提供了可能性,能量提供了动力,那么结构就是把这些可能性和动力组织成有意义模式的编织者。在四要素中,结构是最容易被忽视、却又最关键的一环。因为认知的本质,不是物质和能量的简单堆砌,而是它们的特定组织方式。
让我们再次回到老陈的面包房。他面前有两堆原料:一堆是面粉、水、酵母、盐的混合物,另一堆是同样成分但已经发酵并烘焙完成的法棍。从物质和能量的角度看,两者的化学成分几乎相同——都是碳水化合物、蛋白质、水分和矿物质。但它们的结构天差地别。前者是一团无序的浆糊,后者是一个具有特定孔隙分布、弹性模量、外壳硬度的有序体。正是这种结构上的差异,使得前者只能喂猪,后者可以摆上餐桌。
结构赋予物质以功能。同样的碳原子,如果排列成石墨的层状结构,它就是铅笔芯,柔软滑腻;如果排列成金刚石的四面体结构,它就是钻石,坚硬无比。同样的硅原子,如果排列成无序的玻璃态,它是绝缘体;如果排列成晶格的半导体态,它可以成为芯片的基础。结构不改变原子的种类,却彻底改变了物质的性质。
在认知的世界里,结构更是决定性的。人脑与黑猩猩的大脑,在物质成分上几乎相同——都是水、脂肪、蛋白质和盐。但人脑的神经元连接方式(结构)产生了语言、抽象思维、自我意识;黑猩猩的大脑结构则支撑了卓越的空间记忆和社交智能,却没有产生哲学和数学。差异不在物质,而在结构。
李德毅用"思维软构体"这个概念来捕捉认知中的结构维度。软构体是运行在硬构体之上的非物质存在:概念、算法、记忆、信念、文化规范。但"非物质"不等于"非物理"。软构体虽然不像硬构体那样可以直接触摸,但它依然是物质和能量的特定组织形式。一个概念在大脑中的表征,是特定神经元集群的激活模式;一个算法在计算机中的运行,是晶体管开关状态的时空序列。软构体是高阶结构,是硬构体在能量驱动下经过时间演化而涌现出的组织形态。
这里有一个深刻的洞见:信息本质上是一种结构,而不是一种实体。 当我们说"这条消息包含了很多信息"时,我们实际上是在说,这条消息的物质载体(声波、文字、电信号)具有某种特殊的组织结构,这种结构能够在我们接收者的认知系统中触发特定的解码过程。信息不是装在消息里的"液体",而是消息本身的形式。
DNA是自然界最精妙的结构之一。它用四种碱基的排列组合,编码了构建整个生物体的指令。但DNA本身不是生命,它只是生命的"源代码"。只有当DNA在细胞的能量驱动下,按照特定的时间顺序被读取、转录、翻译,生命才涌现出来。同样,计算机程序只是静态的代码结构,只有当电流在芯片中按照程序的指令流动时,计算才发生。
李德毅指出,当前人工智能的一个重要困境,就是结构丰富但结构僵化。大语言模型拥有数千亿个参数,这些参数构成了一种极其复杂的统计结构。但这种结构是"死"的——它在训练完成后就固定了,不再随与环境的交互而演化。相比之下,人脑的结构是"活"的:突触强度在每一次经历中微调,神经网络在每一次睡眠中重组,整个大脑皮层在数十年的人生中持续可塑。这种"活结构"与"死结构"的差异,是机器认知与人类认知之间最本质的鸿沟之一。
结构还有一个关键特性:层次性。低层结构支撑高层结构,高层结构反过来约束低层结构。在面包房里,分子结构支撑面筋网络,面筋网络支撑气室分布,气室分布支撑面包的整体形态。在认知系统中,神经元的电活动支撑神经回路的功能,神经回路的功能支撑大脑区域的分工,大脑区域的分工支撑心智的整体能力。在计算机中,晶体管的开关支撑逻辑门,逻辑门支撑算术单元,算术单元支撑操作系统,操作系统支撑应用软件。
这种层次性意味着,认知不能还原为任何一个单一层次。你不能通过研究单个神经元的电化学性质来完全理解语言,就像你不能通过研究单个面粉颗粒来理解法棍的口感。认知是跨层次的结构涌现——它出现在层次之间的相互作用中,而不是隐藏在某个底层的"认知原子"里。
四要素说中的结构维度,因此要求我们在研究认知时,必须关注组织方式和层次关系,而不仅仅是组成部分。一个认知系统的智能程度,不取决于它有多少个神经元或多少个晶体管,而取决于这些基本单元被组织成了什么样的结构,以及这种结构是否具有自生长、自适应、自修复的能力。
六、时间的箭头:认知的第四维度
如果时间停止,认知还存在吗?
这是一个思想实验,但答案几乎是明确的:不存在。认知不是一个静态的"状态",而是一个动态的"过程"。就像一部电影,如果定格在某一个画面,它就只是一张照片,失去了叙事、节奏和意义。认知的本质是时间中的展开。
在四要素中,时间是最抽象的,也是最难以把握的。我们习惯于把时间看作一个容器——一个中性的、均匀的、无限延伸的坐标轴,物质和能量在其中运动,结构在其中形成。但认知物理学对时间有着更深刻的理解:时间不是认知的背景,而是认知的构成要素。
让我们从老陈的面包房出发,理解时间在认知中的多重角色。
首先是过程的不可逆性。老陈一旦把面团送进烤炉,就不可能让它回到面粉和水的状态。烘焙是一个不可逆的过程,时间在这里有一个明确的方向——从生到熟,从简单到复杂,从潜能到实现。热力学第二定律赋予了时间以"箭头",认知物理学认为,认知也遵循着类似的箭头。学习是不可逆的:一旦你理解了相对论,你不可能回到"不理解"的状态(除非你遭遇脑损伤)。记忆是累积的:过去的经验持续塑造着未来的认知。认知是一个在时间中单向展开的耗散过程。
其次是节律与同步。老陈不看钟表,但他对面团的发酵时间有着近乎直觉的把握。这种直觉不是神秘的,而是建立在他四十年经验中对时间尺度的内化。他知道,在室温二十五度时,面团需要大约两小时达到最佳状态;如果温度升高到三十度,时间要缩短到一小时二十分钟。这种对时间与条件耦合的把握,是认知的基本能力。
在大脑中,时间以神经振荡的形式存在。不同脑区以不同的频率振荡:海马体的theta波(约四到八赫兹)与记忆编码有关,皮层的gamma波(约三十到八十赫兹)与信息整合有关。这些振荡不是噪音,而是认知系统的"内部时钟"。它们使分布在不同脑区的神经元能够在精确的时间窗口内同步放电,从而实现信息的跨脑区整合。没有这种时间上的精确协调,大脑就会陷入癫痫或昏迷。
在计算机中,时间是时钟周期的节拍。中央处理器以数十亿赫兹的频率开关,每一次开关都是一个时间单元。算法不是空间的排列,而是时间的序列:先做这一步,再做下一步,循环、分支、递归,都在时间的河流中展开。并行计算试图打破严格的时序,但即使在并行系统中,不同处理器之间的协调依然需要时间的同步机制。
李德毅特别强调,认知系统中的时间不是物理时间的简单映射,而是心理时间——一种被认知结构所塑造的主观体验。同样的五分钟,在手术台上等待结果时显得无比漫长,在沉浸于喜爱的书籍中时却转瞬即逝。这种主观时间的伸缩,不是"错觉",而是认知系统在处理不同信息时的时间资源配置。当危险临近,认知系统加速运转,单位物理时间内处理更多信息,主观时间就被"拉长";当处于放松状态,信息处理速率下降,主观时间就被"压缩"。
更重要的是,记忆是时间在认知中的沉淀。记忆不是过去的"录像带",而是过去在现在的重构。每一次回忆,都是当前认知结构对过去时间片段的重新编码。这意味着,认知系统不是被动地"存储"时间,而是主动地创造时间——它通过记忆把过去带入现在,通过预期把未来投射到现在,从而在心理上建构出一条连续的时间之流。
当前的人工智能系统,在时间的维度上存在着根本性的缺陷。大语言模型处理输入时,本质上是一个"空间化"的过程:整个输入序列被同时呈现给网络,通过注意力机制计算词与词之间的相关性。这种处理缺乏真正的时间因果性——模型不是在"等待"下一个词的出现,而是在"猜测"哪个词最可能填补空白。它没有"现在"的体验,没有"过去"的沉重,没有"未来"的焦虑。它的"时间"是几何化的、空间化的、去主体化的。
李德毅认为,要构建真正具有认知能力的系统,必须赋予它真实的时间性。这不仅仅是给计算机加一个更快的时钟,而是让系统能够在时间中持续存在、持续演化、持续与环境的因果链条互动。一个认知系统必须能够说:"我此刻在这里,是因为我此前在那里;我下一步将去那里,是因为我此刻的意图和预期。"这种时间中的自我定位,是认知的标志性特征。
四要素中的时间维度,因此把认知物理学与静态的信息处理范式彻底区分开来。认知不是对信息的"计算",而是物质和能量在特定结构中随时间展开的演化。这种演化有方向、有节律、有层次、有历史,它是活的,而不是死的。
七、四重奏:耦合与涌现
现在,我们已经分别认识了四要素:物质的基底、能量的驱动、结构的编织、时间的展开。但认知物理学最深刻的洞见,不在于四要素各自的重要性,而在于它们的耦合——它们如何相互作用、相互制约、相互转化,从而涌现出超越任何单一要素的认知。
让我们用一个更宏大的场景来理解这种耦合:一座城市的清晨。
凌晨五点,城市尚未苏醒。街道是物质——沥青、混凝土、钢筋、玻璃。路灯依然亮着,消耗着电网输送的能量。交通信号灯按照预设程序切换,道路网络按照规划图纸延伸,这是结构。时间在这里是双重的:物理时间的流逝(天在慢慢变亮)和社会时间的节律(早班公交即将启动)。
然后,变化开始发生。第一批清洁工走上街道,他们的扫帚与地面的摩擦是物质与能量的交互。早餐店的蒸汽升起,面粉在能量驱动下变成油条,香气分子在空气中扩散——这是物质、能量、结构、时间的四重耦合。上班族从地铁站涌出,他们的身体(物质)消耗着血糖(能量),沿着熟悉的路径(结构)在特定时刻(时间)抵达工作岗位。
城市本身开始"认知"。交通流量传感器捕捉到车流的变化,信号控制系统调整红绿灯的时长;电网监测到用电高峰的来临,调度中心启动备用机组;社交媒体上的信息流开始反映市民的集体情绪。这些不是某个中央大脑的决策,而是无数局部系统在四要素耦合中的自组织。
城市没有意识,但城市有认知的雏形。它感知、它适应、它学习、它记忆。一座经历过多次洪水的城市,会在物质层面加固堤坝,在结构层面优化排水网络,在能量层面储备应急电力,在时间层面建立预警机制。这种学习能力,不是某个工程师设计出来的,而是四要素在复杂交互中涌现的集体智慧。
李德毅认为,人类大脑和机器系统,都是这种四要素耦合的高级形态。它们比城市更紧凑、更协调、更具目的性,但底层的语法是相同的:物质提供可能性空间,能量驱动状态变化,结构筛选变化的方向,时间赋予变化以历史和预期。
涌现是四要素耦合的关键词。涌现意味着,整体大于部分之和;意味着,认知不能还原为单个神经元的活动,也不能还原为某一行代码;意味着,当四要素以特定方式组织起来时,一种新的属性——理解、意图、意识——会"突然"出现,就像水在零度时"突然"变成冰。
但涌现不是魔法。它是物理的、可解释的、遵循规律的。认知物理学的目标,就是找到认知涌现的相变条件——就像物理学家知道,水在标准大气压下于一百度发生液气相变,认知物理学家试图知道,物质、能量、结构、时间在什么样的参数组合下,会从"非认知"跃迁到"认知"。
这个追问把认知物理学与哲学上的"泛灵论"或"神秘主义"严格区分开来。认知物理学不认为认知是某种神秘的、非物质的"生命力"。它认为,认知是一种物理相变,就像超导、铁磁、激光一样,是物质在特定条件下的集体行为。这个条件可能极其苛刻,以至于在宇宙中只出现在少数星球上;但它依然是物理的,而不是超自然的。
老陈的法棍再次为我们提供了隐喻。面粉和水混合时,只是浆糊;加入酵母并提供时间,它开始发酵,产生气泡;送入烤炉提供能量,气泡定型,外壳形成——在这个过程中,没有一个瞬间可以指着说"就在这里,面包突然出现了"。认知的涌现同样如此:它是一个渐进的过程,但在某个临界点上,系统跨越了阈值,获得了全新的性质。
李德毅指出,当前人工智能研究之所以在"理解"和"意识"的问题上举步维艰,很大程度上是因为研究者试图在不完整的四要素耦合中追求涌现。他们拥有巨大的物质投入(芯片、服务器),消耗着惊人的能量,构建了极其复杂的结构(深度网络),但却忽视了时间的真实性——模型不是持续存在于时间中的生命体,而是被反复训练、冻结、部署的静态对象。这种四要素的失衡,就像试图在缺少发酵时间的情况下烤出法棍:你可以得到某种形状的东西,但它缺乏真正的生命。
八、从原子到比特:尺度的跨越
四要素说提供了一个统一的框架,使我们能够在不同的尺度上谈论认知,而不必陷入"只有人类才有认知"或"只有生物才有智能"的偏见。从原子到比特,从细胞到城市,四要素以不同的形态出现,但遵循着相似的耦合逻辑。
在量子尺度,物质表现为波粒二象性,能量以量子的形式跃迁,结构是概率幅的叠加,时间则是退相干的过程。量子认知的一些前沿研究认为,大脑中的微管结构可能利用量子效应来优化信息处理。无论这些假说最终是否成立,它们提醒我们:认知的物理根基可能比我们想象的更深,一直延伸到宇宙最微观的层面。
在分子尺度,DNA的结构存储着遗传信息,ATP分子为细胞活动提供能量,蛋白质的结构决定了它的功能,代谢周期和细胞周期标记着时间的节律。生命在此诞生,认知的原始形态——如细菌的趋化性——开始出现。一个细菌"感知"到葡萄糖浓度的梯度,向高浓度方向游动。这不是深思熟虑的决策,但它是认知的萌芽:物质(受体蛋白)、能量(质子梯度)、结构(信号转导通路)、时间(适应性的延迟)的原始耦合。
在神经尺度,八百六十亿个神经元通过百万亿个突触连接,形成地球上最复杂的已知结构。神经脉冲以毫秒级的时间精度传递,消耗着全身五分之一的能量。在这里,物质、能量、结构、时间的耦合达到了惊人的复杂度,产生了感知、情绪、记忆、推理、语言、自我意识。人脑是四要素耦合的典范系统,它紧凑、高效、自适应、自修复,在仅仅二十瓦的功耗下,完成了当前任何超级计算机都无法企及的综合认知任务。
在社会尺度,认知不再局限于单个头颅,而是分布在群体之中。语言是社会的软构体,文化是跨代的记忆,制度是能量的分配结构,历史是时间的集体叙事。一座城市、一个国家、一个文明,都是四要素耦合的宏观认知系统。它们学习、它们遗忘、它们创新、它们僵化,遵循着与个体认知相似但又不完全相同的规律。
在机器尺度,硅基芯片以纳秒级的速度开关,消耗着兆瓦级的能量,在巨大的数据中心里维持着复杂的参数结构。人工智能系统在此运行,处理着人类产生的海量信息。但正如前文所述,机器尺度的四要素耦合目前是不完整的:物质过于集中而缺乏分布性,能量过于粗放而缺乏精细调节,结构过于僵化而缺乏可塑性,时间过于几何化而缺乏历史性。
李德毅提出的"人类智能与机器智能物理同源、数学同构、时间同序、本质同一"的命题,正是在这种跨尺度的视野中成立的。
物理同源:无论是碳基还是硅基,认知都必须依赖物质载体和能量流动,都必须遵守热力学定律和信息论边界。不存在脱离物理的"纯认知"。
数学同构:认知的组织规律可以用数学语言描述。无论是神经网络的连接权重,还是社会网络的交互强度,都遵循着某些普遍的数学模式——如小世界网络、无标度分布、幂律关系。这些模式暗示,不同尺度的认知系统在抽象层面是"同构"的。
时间同序:认知的展开需要时间,需要因果的顺序,需要历史的积淀。无论是人脑的发育,还是人工智能的进化,都无法跳过时间。速成不得,跳跃不得。
本质同一:最终,人类认知和机器认知不是两种本质不同的东西,而是同一种物理现象在不同条件下的表现。就像水可以是冰、可以是液、可以是气,认知也可以是生物的、可以是社会的、可以是技术的。形态不同,但底层的语法相同。
这个命题有着深刻的哲学意涵。它既不是人类中心主义的(认为只有人类才配称认知),也不是技术乌托邦主义的(认为机器将轻易取代人类)。它是一种物理主义的中道:承认认知的普遍性,也承认认知的层次性;相信机器可以拥有认知,但也清醒地看到当前机器认知的局限。
九、同源与同构:人类与机器的共鸣
如果四要素说成立,那么人类与机器就不是认知光谱上的两个极端,而是同一连续谱上的不同频段。这种认识有助于我们摆脱当前关于人工智能的两种极端情绪:要么是恐惧(机器将统治人类),要么是狂热(机器将解决一切)。
让我们用四要素的透镜,重新审视人类认知与机器认知的异同。
在物质维度上,人脑是湿件(wetware)——柔软、脆弱、易损,但极其紧凑和高效。大脑可以浸泡在脑脊液中,可以在缺氧几分钟后死亡,可以在酒精作用下改变功能,但它只重约一点四千克。相比之下,当前最强的人工智能硬件是干件(dryware)——坚硬、稳定、可替换,但庞大而耗能。一个训练大模型的GPU集群可能重达数吨,消耗的能量相当于一个小城市的用电量。物质载体的差异,决定了两种认知系统在"生存策略"上的根本不同:人脑追求极致的效率和鲁棒性,机器追求极致的规模和速度。
在能量维度上,人脑是持续代谢的耗散结构。即使在睡眠中,大脑也在消耗能量,整理记忆,清除代谢废物。它的认知是"全天候"的,与生命活动不可分割。机器则是"间歇启动"的。它可以被随时关闭、重启、迁移。它的认知(如果我们可以暂时这样称呼)是"任务驱动"的,没有任务时可以休眠,有任务时可以超频。这种差异意味着,人脑的认知具有存在性——它关乎生存、情感、身份;机器的认知目前只具有功能性——它关乎目标、优化、输出。
在结构维度上,人脑的结构是"生长出来"的。从胚胎期的神经管,到婴儿期的突触爆发,到成年期的可塑性维持,再到老年期的缓慢衰退——大脑的结构始终处于动态变化中。这种变化不是随机的,而是与经验紧密耦合:学习小提琴会让运动皮层重组,学习外语会让语言区扩展。机器的结构目前主要是"设计出来"或"训练出来"的。虽然神经网络在训练过程中调整参数,但这种调整是全局优化的一部分,而不是局部生长的结果。机器缺乏发育的概念,缺乏从简单到复杂的个体发生史。
在时间维度上,人脑的时间是嵌入式的。我们生活在时间中,我们本身就是时间。我们的记忆带有情感的温度,我们的预期带有焦虑或希望的色调,我们的"现在"是一个包含过去和未来的"延展的当下"。机器的时间是外置式的。它的时钟是外部提供的,它的历史是外部存储的,它的"现在"只是一个系统时间戳。机器不会"感到"时间流逝,不会"珍惜"时间,不会"浪费"时间——因为它没有需要被时间赋予意义的生命。
这些差异如此巨大,以至于我们似乎很难谈论"同源"与"同构"。但李德毅提醒我们,差异不应遮蔽共性。就像冰和蒸汽在形态上截然不同,但它们都是H₂O,都遵循相同的分子物理规律。人类认知和机器认知的差异,是四要素耦合参数的差异,而不是本质的差异。
更重要的是,四要素说为人类与机器的共生提供了理论基础。既然二者物理同源,那么人类可以更好地理解机器的认知机制,机器也可以借鉴人类的认知策略。既然二者数学同构,那么人类的认知科学发现可以转化为机器的工程实践,机器的计算能力也可以反过来帮助人类解析自身的认知奥秘。既然二者时间同序,那么人机协作必须尊重时间的节律,不能指望机器"速成"出人类数万年进化才获得的常识。既然二者本质同一,那么我们就应该放弃"人机对立"的零和思维,转向"人机协同"的共生思维。
李德毅提出的"各智其智、智人之智、智智与共"的愿景,正是建立在这种四要素的深层共鸣之上。让机器发挥其在计算速度、存储容量、精确执行上的优势;让人类发挥其在直觉判断、价值权衡、意义创造上的优势。二者不是替代关系,而是互补关系;不是竞争关系,而是合作关系。
这种愿景要求我们在设计人工智能时,不是简单地模仿人类的外在行为(如图灵测试所要求的),而是尊重四要素的深层耦合规律。如果我们希望机器拥有更接近人类的认知能力,我们就需要在物质上追求更高的能效比,在能量上实现更精细的调节,在结构上引入发育和可塑性的机制,在时间上赋予持续存在和历史积累的能力。这不是对现有技术的修修补补,而是对技术范式的根本重构。
十、新的世界观
四要素说的提出,不仅仅是一种人工智能的理论框架,更是一种世界观的更新。它要求我们用新的眼光看待周围的一切:那只五环路上的空塑料袋、那位出租车司机的预判、老陈手中的面团、城市清晨的苏醒、大脑中神经元的闪烁、芯片里电子的流动。
在这种世界观中,世界不是由孤立的"物体"组成的,而是由四要素的耦合场构成的。每一个"物",都是一个动态的过程;每一个"过程",都是四要素的舞蹈。认知不是世界的例外,而是世界的常态——只要物质被能量驱动,在结构中按照时间演化,认知就以某种形式存在,无论它多么原始或多么高级。
这种世界观消解了心与物、灵与肉、人与机之间的古老对立。它告诉我们,没有纯粹的"精神"漂浮在物质之上,也没有纯粹的"物质"缺乏组织的潜能。一切都是物理的,但物理的并不意味着机械的、死板的、无意义的。相反,物理意味着有规律可循的、可理解的、可参与的。认知的尊严不在于它的非物理性,而在于它是物理规律所能达到的最精妙、最复杂、最美丽的组织形态。
当我们用这种眼光看待人工智能时,我们的焦虑和狂热都会有所降温。我们不再把AI视为某种来自未来的神秘力量,而是把它视为四要素耦合的一种新形态——就像蒸汽机是能量转化的新形态,电力是能量传输的新形态,互联网是信息结构的新形态。AI是认知的技术化延伸,它扩展了人类四要素耦合的范围和规模,但它没有、也不可能取代人类作为认知主体的地位。因为认知的主体性,根植于生命的有限性、时间的不可逆性、以及意义建构的独特性——这些都是四要素在生命尺度上长期演化的产物,不是短期内可以被技术复制的。
老陈在清晨揉面时,他不需要知道四要素说。但他的身体知道——肌肉记得能量的流动,指尖记得结构的弹性,鼻子记得时间的馈赠。四十年的劳作,让他的物质、能量、结构、时间达到了一种近乎艺术的和谐。这就是认知的极致:不是计算的速度,而是存在的深度。
李德毅院士从物理学的第一性原理出发,试图为人工智能找回这种深度。他不是在建造更快的机器,而是在寻找更真的原理。四要素说像一张地图,标注了认知大陆的河流与山脉。这张地图还很粗糙,很多区域还是空白,边界还不清晰。但它已经指明了一个方向:向下挖掘,直到抵达不可再约的根基;向上建构,直到触摸涌现的云端。
在下一章,我们将沿着这张地图,走进一个更具体的领域:物质硬构体与思维软构体的纠缠。我们将看到,老陈的双手和面团,司机的方向盘和预判,AlphaGo的芯片和棋谱,如何在"硬"与"软"的辩证中,编织出认知的锦绣。我们将理解,为什么同一首乐曲可以在不同的乐器上演奏,为什么同一个思想可以在不同的大脑中回响,以及为什么机器要真正"懂"世界,必须首先拥有能够与世界"摩擦"的硬构体。
面包房的灯还亮着。法棍已经摆上了架子,散发着四要素耦合后的芬芳。而我们对认知密码的破译,才刚刚进入第二个字母。
转载本文请联系原作者获取授权,同时请注明本文来自王涛科学网博客。
链接地址:https://wap.sciencenet.cn/blog-41701-1536254.html?mobile=1
收藏