科学网-《科学史的历史》第八章：认知革命——从行为主义到心智的计算隐喻-王涛的博文

《科学史的历史》第八章：认知革命——从行为主义到心智的计算隐喻

2026-5-15 20:26

阅读：317

《科学史的历史》

第八章：认知革命——从行为主义到心智的计算隐喻

一、1956年的夏天

1956年夏天，美国新罕布什尔州汉诺威镇，达特茅斯学院的数学系楼里，一群年轻人围坐在一张长桌旁，窗外是郁郁葱葱的枫树，蝉鸣声此起彼伏。他们中有数学家、心理学家、工程师和逻辑学家。会议的组织者是一位二十八岁的助理教授，名叫约翰·麦卡锡。他在邀请函中写道："我们提议1956年夏天在达特茅斯学院进行一次为期两个月、十人参加的人工智能研究项目。学习的每一个方面或智能的任何其他特征，原则上都可以被精确描述，以至于能够用机器来模拟。我们将尝试发现如何让机器使用语言、形成抽象概念和概念、解决目前留给人类的各种问题，并改进自己。"

这份邀请函后来被视为人工智能的出生证。参加会议的人包括克劳德·香农——信息论的创始人，马文·明斯基——后来成为人工智能的奠基人之一，纳撒尼尔·罗切斯特——IBM第一台商用计算机的设计师，以及赫伯特·西蒙和艾伦·纽厄尔——一对即将改变心理学和计算机科学的搭档。他们带着不同的野心来到汉诺威：有人想造出能思考的机器，有人想用机器理解人类思维，有人则单纯被"智能能否被计算"这个古老问题所吸引。

但1956年的意义远不止人工智能的诞生。同一年，在麻省理工学院，一位二十九岁的语言学家诺姆·乔姆斯基出版了他对伯尔赫斯·斯金纳《言语行为》的书评，这篇书评像一颗精确制导的炸弹，摧毁了统治美国心理学四十年的行为主义。在哈佛大学，一位三十一岁的心理学家乔治·米勒在《心理学评论》上发表了《神奇的数字七，加减二：我们信息加工能力的某些极限》——这篇论文开创了认知心理学的新纪元。在普林斯顿，西蒙和纽厄尔正在调试他们的"逻辑理论家"程序——第一个能够证明数学定理的计算机程序。

1956年因此被称为"认知革命"元年。这不是一场有组织的政治运动，而是一系列分散的、几乎同时发生的思想地震。它们共享一个核心信念：心智不是黑箱，它可以被打开、被分析、被建模、被模拟。这个信念在二十年后彻底改变了心理学、语言学、神经科学和哲学，也为我们今天理解"活性算法"提供了最直接的前史。

但认知革命的故事不能从1956年开始。要理解为什么这一年在科学史上如此重要，我们必须先回到那个被革命推翻的旧世界——行为主义的帝国。

二、黑箱的统治

1913年，约翰·布罗德斯·华生站在哥伦比亚大学的讲台上，宣读了一篇简短的宣言。他宣布，心理学必须放弃对意识、感觉、意象等"主观"现象的研究，转而研究可观察的行为。华生写道："心理学作为一门行为科学，必须抛弃所有对意识的提及。"这个宣言标志着行为主义的诞生，也标志着心理学与"心智"概念的正式决裂。

华生的激进有其时代背景。二十世纪初，心理学刚刚从哲学中独立出来，迫切需要建立自己的科学身份。物理学家和化学家嘲笑心理学是"软科学"，因为它的研究对象——意识——无法被客观测量。华生的解决方案是干脆放弃意识，只研究刺激与反应之间的关系。如果心理学能预测"给定刺激S，有机体将产生反应R"，那么它就是一门真正的自然科学。

华生的继承者伯尔赫斯·弗雷德里克·斯金纳将行为主义推向了极致。斯金纳是操作性条件反射的大师，他设计了著名的"斯金纳箱"——一个装有杠杆和食物投放装置的封闭箱子。箱子里的小白鼠学会按压杠杆获取食物，鸽子学会啄击特定图案获得奖励。斯金纳认为，所有行为，无论是老鼠按压杠杆还是人类创作诗歌，本质上都是强化历史的产物。环境通过奖励和惩罚塑造行为，而行为背后的"心智"——如果有的话——只是一个不必要的假设。

斯金纳的《有机体的行为》（1938）和《科学与人类行为》（1953）成为了美国心理学的圣经。在1950年代，美国几乎所有的心理学系都被行为主义者主导。他们研究条件反射、学习曲线、强化程序，拒绝谈论"思维""记忆""概念"——这些词被认为是前科学的、形而上学的残余。斯金纳甚至试图用操作性条件反射来解释语言：儿童学会说话，是因为父母在他们发出正确声音时给予了奖励。

行为主义的成功是真实的。它提供了精确、可重复的实验方法；它催生了行为疗法，帮助人们克服恐惧症和成瘾；它在二战期间被用于训练士兵和鸽子（斯金纳确实训练过鸽子制导导弹）。但行为主义也有其盲区。它无法解释儿童如何在短短几年内掌握复杂的语言结构——毕竟，父母并不会系统性地强化每一个正确的语法句子。它无法解释创造性——如果所有行为都是过去强化的产物，那么全新的想法从何而来？它更无法解释理解——老鼠按压杠杆和人类理解微积分，真的只是程度差异吗？

行为主义将心智锁进黑箱，贴上"禁止打开"的标签。但黑箱内部并非空无一物，而是充满了低语。1956年，有人终于决定撬开箱子。

三、乔姆斯基的炸弹

1959年，《语言》期刊上发表了一篇长达三十三页的书评，评论对象是斯金纳三年前出版的《言语行为》。书评作者是一位名不见经传的年轻语言学家，名叫诺姆·乔姆斯基。他刚刚在麻省理工学院获得教职，此前在宾夕法尼亚大学研究现代希伯来语，对逻辑学和数学哲学有浓厚兴趣。

乔姆斯基的书评是科学史上最具破坏力的学术文本之一。他没有使用实验数据，没有引用统计结果，而是纯粹通过逻辑分析，展示了斯金纳的理论框架在解释语言时的荒谬性。斯金纳用操作性条件反射的术语来描述语言：说话是"言语行为"，听者反应是"强化"，语义是"刺激控制"。乔姆斯基逐条拆解了这些概念，指出它们要么过于宽泛以至于可以解释一切（从而什么也解释不了），要么过于狭窄以至于无法解释最简单的语言现象。

但乔姆斯基的批判不止于方法论。他提出了一个更深层的论点：语言不是行为，而是结构。儿童能够在没有充分外部输入的情况下，掌握复杂的语法规则，生成和理解无限数量的句子。这种现象被称为"刺激贫乏"（poverty of the stimulus）——儿童听到的语言样本是有限的、有噪音的、甚至包含错误的，但他们却能提炼出普遍的语法规则。这意味着，心智不是被动的白板，等待环境在上面书写；心智有先天的结构，一种"普遍语法"，它为语言学习提供了生物学基础。

乔姆斯基的论点直接挑战了行为主义的核心假设。如果心智有先天结构，那么心理学就不能只研究行为；它必须研究这些内部结构。如果语言是规则系统而非习惯总和，那么"思维"就不是一个需要被放逐的幽灵，而是科学研究的合法对象。乔姆斯基后来回忆说，他写这篇书评时并没有意识到其影响会超出语言学领域。但历史证明，这篇书评成为了认知革命的宣战书。

乔姆斯基的影响是双重的。一方面，他让语言学家重新关注心智的内部表征——语法规则、深层结构、转换操作。另一方面，他为所有研究"心智"的学科提供了认识论许可：谈论内部结构不是唯心主义，而是科学。在乔姆斯基之后，心理学家可以合法地研究"记忆编码"而不怕被指责为"主观主义"；计算机科学家可以谈论"知识表征"而不怕被嘲笑为"拟人化"；神经科学家可以探索"大脑如何计算"而不必担心越界。

四、神奇的数字

就在乔姆斯基摧毁行为主义的同时，另一位年轻学者正在从内部瓦解心理学的另一座堡垒。1956年，乔治·米勒在贝尔实验室工作，这家电话公司的研究机构聚集了当时世界上最优秀的数学家、工程师和心理学家。贝尔电话公司面临一个实际问题：电话交换台的接线员如何记住电话号码？号码太长，容易遗忘；太短，又不够用。公司需要知道人类记忆的极限在哪里。

米勒的解决方案不是设计更好的记忆训练，而是重新定义问题。他意识到，人类短期记忆的容量不是由"信息比特"的数量决定的，而是由"组块"（chunk）的数量决定的。一个组块是一个有意义的单元——对于熟悉英语的人，"FBI"是一个组块（三个字母），而不是三个独立的字母。米勒发现，无论组块的内容是什么（数字、字母、单词、概念），人类短期记忆能够同时保持的组块数量大致是七个，加减二。

这个发现发表在《神奇的数字七，加减二》中，成为了认知心理学最著名的论文之一。但米勒的贡献远不止一个数字。他引入了信息论的框架来分析心智。克劳德·香农的信息论将通信定义为信息的传输和编码，米勒将这套语言移植到心理学中：心智是一个信息加工系统，它接收输入（感觉），进行编码（知觉），存储（记忆），检索（回忆），输出（行为）。这个框架让心理学家可以用工程学的语言来谈论"记忆容量""编码效率""信息瓶颈"——而不必诉诸于"意识流"或"心灵剧场"等模糊的隐喻。

米勒后来与尤金·加兰特和卡尔·普里布拉姆合著了《行为计划与结构》（1960），进一步发展了信息加工模型。他们提出，行为不是简单的刺激-反应链条，而是层级化的计划——从最高层的"目标"到中层的"策略"再到最低层的"操作"。这个模型与乔姆斯基的语法层级结构形成了呼应：无论是语言还是行为，心智都通过层级组织来管理复杂性。

信息加工心理学的诞生，标志着心理学从"行为科学"向认知科学的转变。心理学家不再满足于描述"给定刺激，有机体如何反应"；他们开始追问：刺激如何被表征？信息如何被编码？记忆如何被存储和提取？这些问题将"黑箱"重新打开，但这一次，箱子里装的不是神秘的精神实体，而是可计算的信息流程。

五、通用问题求解者

1956年的达特茅斯会议上，赫伯特·西蒙和艾伦·纽厄尔带来了他们最新的成果——"逻辑理论家"（Logic Theorist）。这个程序能够证明罗素和怀特海《数学原理》中的定理。它不是简单地搜索所有可能的证明路径（那将耗费无限时间），而是使用启发式——经验性的规则，指导搜索朝向有希望的领域。逻辑理论家成功证明了《数学原理》第二章的三十八个定理，其中某些证明甚至比原书更简洁。

西蒙后来回忆说，当他第一次运行逻辑理论家并成功证明定理时，他体验到了一种"宗教般的敬畏"。不是因为机器比人聪明，而是因为它证明了：思维可以被符号化，推理可以被程序化。如果机器能够证明定理，那么心智的运作方式，至少在某种程度上，类似于符号操作。

西蒙和纽厄尔随后开发了更雄心勃勃的"通用问题求解者"（General Problem Solver, GPS）。GPS不仅能证明定理，还能解决逻辑谜题、进行代数运算、甚至玩简单的游戏。它的核心思想是手段-目的分析：给定一个目标状态和一个当前状态，系统找出两者之间的差异，然后选择一个能够缩小这种差异的操作。这个过程递归进行，直到当前状态与目标状态重合。

GPS体现了认知革命的一个核心隐喻：心智即计算机。这个隐喻不是指大脑由硅芯片构成（显然不是），而是指心智的运作类似于计算机程序：它接收符号输入，根据规则操作符号，产生符号输出。西蒙和纽厄尔在1976年提出了"物理符号系统假说"：任何能够产生智能行为的系统，必然是一个物理符号系统；任何足够复杂的物理符号系统，必然能够表现出智能。

这个假说成为了人工智能和认知科学的共同纲领。它意味着，智能的本质不在于物质载体（神经元或晶体管），而在于符号操作的形式。只要系统能够表征问题空间、搜索解决方案、应用启发式，它就能表现出智能——无论它是人脑、计算机还是外星硅基生命。

但物理符号系统假说也埋下了未来的冲突种子。它将心智视为离身的（disembodied）——一个漂浮在物质之上的符号处理器。这种观点在1980年代后受到了严峻挑战，但在1950至1970年代，它几乎是认知科学无可争议的正统。

六、计算隐喻的霸权

到了1970年代，"心智即计算机"的隐喻已经渗透到认知科学的每一个角落。心理学家谈论"心理表征"——心智中的符号结构，对应于外部世界的对象和关系。语言学家谈论"心理语言"（mentalese）——一种假设的、所有人类共享的内部思维语言。神经科学家开始将大脑描述为"神经网络"——虽然这个术语后来的含义与早期大不相同。哲学家如杰瑞·福多系统阐述了"思维语言假说"：思想不是图像或感觉，而是类似于计算机代码的符号结构。

计算隐喻的吸引力在于它的解释力。如果心智是计算机，那么我们可以用熟悉的计算概念来解释心理现象：记忆是"存储器"，注意是"处理器资源分配"，学习是"程序更新"，遗忘是"数据覆盖"。这种解释框架让认知科学迅速积累了一套共享的词汇和技术，建立了跨学科的对话平台。

图灵测试进一步强化了这种隐喻。1950年，阿兰·图灵在《心智》期刊上发表了《计算机器与智能》，提出了著名的"模仿游戏"：如果一台机器能在文本对话中让人类无法区分它是机器还是人，那么我们就有权说这台机器具有智能。图灵测试将智能从"内部状态"转移到"外部行为"，从"它如何思考"转移到"它表现得如何"。这种操作性定义回避了"机器能否真正思考"的形而上学问题，为人工智能研究提供了实用的目标。

但计算隐喻也有其盲区。它将认知还原为符号操作，忽视了身体、情感、环境和社会的维度。它假设认知是表征性的——心智首先构建外部世界的内部模型，然后基于这个模型进行推理。这种"表征主义"在解释感知运动技能、情感反应、社会互动时显得力不从心。一个熟练的自行车骑手并不依赖对自行车动力学的内部表征；一个母亲识别自己婴儿的声音，并不经过符号解码的过程。

更重要的是，计算隐喻暗示了一种笛卡尔式的二元论：软件（心智）运行在硬件（大脑）之上，两者可以分离。这种观点为后来的"强人工智能"梦想提供了哲学基础——如果智能只是软件，那么我们可以将心智上传到计算机，实现数字永生。但这个梦想忽视了心智的具身性——认知不仅发生在大脑中，更分布在身体、工具和社会网络中。

七、联结主义的幽灵

计算隐喻的第一次重大挑战来自联结主义——今天被称为神经网络或深度学习的前身。1943年，沃伦·麦卡洛克和沃尔特·皮茨提出了一种简化的人工神经元模型，能够执行逻辑运算。1958年，弗兰克·罗森布拉特在康奈尔航空实验室开发了"感知机"（Perceptron）——一种能够通过学习调整连接权重来分类简单模式的神经网络。罗森布拉特乐观地宣称，感知机最终能够"学习、做出决策和翻译语言"。

但1969年，马文·明斯基和西摩·帕珀特出版了《感知机》，对单层神经网络进行了毁灭性的数学分析。他们证明，感知机无法解决简单的"异或"问题（XOR）——如果两个输入相同则输出0，不同则输出1。这个证明在技术上只适用于单层网络，但明斯基和帕珀特的论述语气让整本书读起来像是宣判了联结主义的死刑。他们暗示，更复杂的多层网络也会有类似的问题，而且没有人知道如何训练多层网络。

《感知机》的出版导致了所谓的"第一次AI寒冬"。神经网络研究几乎停滞了十年，资金枯竭，研究者转向其他领域。符号AI——基于逻辑和符号操作的"经典人工智能"——成为了唯一的主流。明斯基本人是符号AI的坚定捍卫者，他相信真正的智能需要符号操作、逻辑推理和明确的知识表征，而不是简单的模式关联。

但联结主义的幽灵从未真正离去。1980年代，一系列技术突破让神经网络重新复活。约翰·霍普菲尔德在1982年提出了联想记忆网络；杰弗里·辛顿和大卫·鲁梅尔哈特等人在1986年推广了反向传播算法——一种能够训练多层神经网络的通用方法。这些发展催生了"并行分布式处理"（PDP）运动，其支持者如鲁梅尔哈特、詹姆斯·麦克莱兰和PDP研究小组，明确挑战了符号AI的霸权。

PDP的核心理念是：认知不是符号操作，而是亚符号的、分布式的、并行的模式处理。知识不是存储在特定的符号结构中，而是编码在连接权重中，分布在网络的整个拓扑结构中。一个神经网络识别面孔，不是通过提取"眼睛""鼻子""嘴巴"的符号特征并进行逻辑推理，而是通过激活模式在整个网络中的流动。这种观点与符号AI形成了尖锐对立：是符号还是亚符号？是串行还是并行？是局部表征还是分布式表征？

这场争论在1990年代逐渐平息，不是因为某一方获胜，而是因为认知科学意识到两者各有其适用范围。符号AI擅长逻辑推理和明确知识；联结主义擅长模式识别和模糊分类。今天的深度学习——联结主义的直系后裔——在图像识别、自然语言处理等领域取得了惊人成就，但它在需要因果推理和抽象规划的领域仍然表现不佳。

八、具身的反叛

如果说联结主义从内部挑战了计算隐喻，那么具身认知（embodied cognition）则从外部发动了更根本的批判。1980年代末至1990年代初，一批研究者开始质疑认知革命的核心假设：心智真的可以被理解为离身的计算吗？

弗朗西斯科·瓦雷拉、埃莱娜·汤普森和埃莉诺·罗施在1991年出版的《具身认知：认知科学与人类经验》中，系统阐述了这种批判。他们指出，认知革命虽然打开了心智的黑箱，但它用"计算机"填充了箱子，这同样是一种还原。心智不是计算机，大脑不是硬件，身体不是输入输出设备。认知是具身的——它依赖于身体的特定形态、感觉运动能力和与环境互动的历史。

一个简单的例子说明了这一点。西蒙曾经描述过一只蚂蚁在沙滩上爬行的路径：看起来复杂曲折，但如果我们考虑到沙滩表面的不规则性和风的吹拂，蚂蚁的行为其实非常简单——它只是遵循"避开障碍、朝向巢穴"的简单规则。西蒙用这个例子来说明"有限理性"——复杂行为可以源于简单规则与环境互动的结果。但具身认知的追随者指出，西蒙仍然将"认知"定位在蚂蚁的"大脑"中，而忽视了身体-环境的耦合本身就是认知的一部分。蚂蚁的腿、触角、与沙粒的物理接触，都是认知系统的组成部分，而不仅仅是"输入设备"。

具身认知的四个E——具身（Embodied）、嵌入（Embedded）、延展（Extended）、生成（Enactive）——共同挑战了离身计算的观点。认知是具身的，因为它依赖于身体的形态和感觉运动系统；认知是嵌入的，因为它发生在特定的环境语境中；认知是延展的，因为它可以扩展到外部工具（如纸笔、计算器、智能手机）；认知是生成的，因为它不是对外部世界的内部表征，而是行动与感知之间的持续循环。

这种转向与活性算法的框架高度一致。活性算法不是离身的符号操作系统，而是嵌入在物质条件中的推断网络。预测误差不是抽象的符号差异，而是身体与环境互动中的实际不匹配。自由能最小化不是发生在虚空中的优化，而是生命系统维持其组织完整性的自维持过程。从具身认知的角度看，活性算法完成了认知革命未竟的事业：它不仅打开了黑箱，更将黑箱重新嵌入到身体、社会和行星的多尺度网络中。

九、从计算到推断

进入二十一世纪，认知科学正在经历第二次范式转换——从"心智即计算机"转向"心智即预测引擎"。这一转向的根源可以追溯到十九世纪的赫尔曼·冯·亥姆霍兹，他提出知觉不是被动接收感觉数据，而是对感觉原因的主动推断。1970年代，理查德·格雷戈里将知觉描述为"假设检验"——大脑根据先验知识对感官输入做出最佳猜测。

但直到2000年代，随着卡尔·弗里斯顿等人提出的自由能原理和预测编码理论，这种"推断"视角才获得了严格的数学形式。根据这一框架，大脑是一个层级化的推断机器：它不断生成关于外部世界的预测，将这些预测与感官输入比较，计算预测误差，然后更新内部模型以减少未来的误差。知觉、行动、学习和注意，都可以被理解为推断的不同方面：知觉是推断隐藏原因，行动是改变感官输入以符合预测，学习是更新生成模型，注意是选择性地放大预测误差。

这个框架与1956年的认知革命形成了深刻的连续性，同时也标志着对它的超越。连续性在于：两者都承认心智的内部结构和信息加工的本质。超越在于：新的框架将不确定性和概率推断置于核心，而非符号逻辑；它将行动视为推断的组成部分，而非推断的输出；它将身体和环境视为认知系统的内在要素，而非外部条件。

从活性算法的角度看，认知革命的六十年历程可以被视为一个自由能景观中的探索过程。行为主义停留在拒绝打开黑箱的局部极小值；符号AI打开了箱子，但陷入"离身计算"的另一个局部极小值；联结主义和具身认知提供了逃逸路径，但缺乏统一的数学框架；而自由能原理和主动推断，似乎找到了一个更深的极小值——一个能够整合认知、行动和感知的统一框架。

但这不意味着终点。正如库恩所教导的，任何范式都有其盲区。预测编码框架在解释高级认知——如语言、文化、自我意识——时仍然面临挑战。它能否解释为什么人类会创作诗歌？能否解释道德判断？能否解释科学革命本身？这些问题可能预示着下一次危机，下一次逃逸，下一个范式。

十、结语：革命尚未完成

认知革命已经走过了近七十年。它让心理学从"行为科学"变成了"认知科学"；它让"心智"重新成为合法的研究对象；它催生了人工智能、神经科学、认知语言学和心灵哲学的繁荣。但它也留下了深刻的偏见：对符号的崇拜、对离身计算的迷恋、对确定性的追求。

今天的转向——具身、嵌入、延展、预测——正在修正这些偏见。它提醒我们：心智不是计算机，而是生命；认知不是计算，而是维持；智能不是符号操作，而是在不确定性中持续推断。这种修正不是对认知革命的否定，而是它的完成。正如拉瓦锡没有否定燃素说时代的实验技术，而是重构了它们的理论基础；今天的认知科学也没有否定1956年的洞见，而是将它们置于更广阔的生物学和生态学框架中。

对于科学史而言，认知革命的教训是双重的。一方面，它展示了跨学科对话的力量：没有数学（信息论）、没有工程学（计算机）、没有语言学（乔姆斯基）、没有心理学（米勒），认知科学不可能诞生。另一方面，它也警示了隐喻的危险：当我们说"心智即计算机"时，我们不仅是在描述，更是在塑造——这个隐喻开启了某些问题，同时关闭了另一些问题。今天的"心智即预测引擎"同样是一个隐喻，它有自己的盲区，自己的排除机制，自己的认识论障碍。

科学史的任务，就是追踪这些隐喻的生命——它们如何诞生，如何统治，如何被挑战，如何被取代。因为最终，我们用来理解心智的工具，本身就是心智的产物。这种自我指涉的循环，既是认知科学的极限，也是它最深刻的魅力。

转载本文请联系原作者获取授权，同时请注明本文来自王涛科学网博客。

链接地址：https://wap.sciencenet.cn/blog-41701-1535022.html?mobile=1

当前推荐数：4

推荐人：

杨正瓴刘进平雒运强宁利中

推荐到博客首页

网友评论0 条评论

该博文允许注册用户评论请点击登录