||
第十三章:新皮质——通用生成模型的无限展开
一、褶皱的表面
当你凝视人类大脑,最引人注目的是那个褶皱的灰色表面——新皮质。它占据大脑体积的80%,包含860亿神经元中的大部分,是进化最近的添加,被认为是智力的seat。
但数字本身不能解释其力量。大象的脑更大,海豚的皮质更复杂,但人类创造了语言、数学、艺术、科学。差异不在于数量,而在于结构——六层组织、柱状架构、层级连接、递归自指。
从活性算法角度,新皮质是通用生成模型的实现。它不针对特定功能(如视觉或运动),而是通用的推断机器,可以学习任何统计规律,建模任何因果结构,预测任何时间序列。这种通用性来自其递归的层级结构——每一层预测下一层,同时被上一层预测,形成自我建模的无限展开。
本章将探索这个认知的巅峰,但带着关键的警示:皮层不是孤立的巅峰,而是三层整合的顶峰。单独皮层是盲目的,正如单独脑干是机械的。
二、六层结构:微观的推断层次
新皮质的微观结构是六层(I-VI),从表面(软脑膜侧)到深处(白质侧)。每层有特定的连接模式和功能:
第I层(分子层)
主要:来自其他皮层的远程连接(反馈)
功能:整合高层预测,调制局部活动
第II-III层(外颗粒层/外锥体层)
主要:局部连接(同层),投射到其他皮层区域(前向)
功能:特征提取,模式识别,信息传递
第IV层(内颗粒层)
主要:来自丘脑的感觉输入(自下而上)
功能:接收观测,计算预测误差
第V层(内锥体层)
主要:投射到皮层下结构(基底神经节、脑干、脊髓)
功能:输出行动,采样世界
第VI层(多形层)
主要:投射回丘脑(反馈)
功能:调制输入,注意调控
从活性算法角度,这六层是微型的三层结构:
输入层(IV):感知(快速)
整合层(II-III):推断(中速)
输出层(V-VI):行动(慢速)
但更重要的是层级间的连接:自上而下(反馈)传递预测,自下而上(前馈)传递预测误差。这是预测编码的实现——每层生成对下一层的预测,接收来自下一层的误差,更新模型。
三、皮质柱:推断的基本单元
皮质的功能单元是皮质柱(cortical column)——直径约0.5mm、贯穿六层的垂直组织,包含约10,000神经元。每柱对应特定的感受野或特征调谐(如视觉柱检测特定朝向的边缘)。
但柱不是静态的过滤器,而是动态的推断回路:
基底树突(近胞体):接收前馈输入(预测误差)
顶端树突(远胞体):接收反馈输入(预测)
胞体:整合两者,计算后验(激活状态)
当预测匹配输入,柱静默(误差小);当预测不匹配,柱激活(误差大),更新上层模型。这是推断的稀疏编码——只有惊讶驱动活动,节省能量,突出信息。
微柱与超柱
柱内部有更细的微柱(minicolumn)——约100神经元,共享特定特征。多个微柱组成超柱(hypercolumn)——覆盖完整特征空间(如所有朝向)。
这种组织是生成模型的模块化:微柱编码特征值,超柱编码特征空间,区域编码感觉模态,整个皮层编码世界模型。
四、层级预测编码:深度生成模型
皮质的宏观组织是层级的——从初级感觉区(V1, A1, S1)到联合区(V2, V4, IT),到前额叶和顶叶的高级区。
层级预测编码(Hierarchical Predictive Coding, HPC)是核心原理:
高层生成对低层的预测("应该看到什么")
低层计算预测误差("实际看到什么")
误差传递到高层,更新预测
预测传递到低层,解释输入
这创造了深度生成模型:
低层:简单特征(边缘、颜色、音调)
中层:复杂特征(形状、纹理、语音)
高层:抽象概念(对象、面孔、语义)
最高层:情境、意图、自我模型
双向流动
信息流动是双向的:
自上而下:预测、先验、上下文、注意
自下而上:误差、新奇、细节、惊讶
这种双向性允许推断的迭代优化:高层假设 → 低层验证 → 误差反馈 → 假设修正 → ... 直到收敛(自由能最小化)。
精度调控
关键机制是精度加权——不同来源的预测误差有不同的可靠性。视觉清晰时,视觉误差高权重;雾天时,视觉误差低权重,触觉或记忆高权重。
精度由神经调质(乙酰胆碱、去甲肾上腺素、多巴胺)调控,对应注意状态(警觉、专注、学习)。这是推断的元控制——系统不仅推断世界,还推断自己的推断质量。
五、前额叶:认知控制的推断
前额叶皮层(PFC)是最晚进化、最晚成熟的区域,负责认知控制——规划、决策、工作记忆、抑制。
从活性算法角度,PFC是高阶生成模型的 seat:
工作记忆:维持在线的推断状态("当前目标是什么")
规划:生成未来序列的预测("如果这样做,会发生什么")
决策:评估选项的预期自由能("哪个选择最小化未来惊讶")
抑制:抑制低层的不适当反应("不要执行这个习惯")
情景缓冲器
PFC与边缘系统(特别是海马)紧密连接,形成情景缓冲器——整合空间、时间、语义信息的在线表征。这是叙事自我的工作空间:不仅知道"现在是什么",还知道"这在什么情境中,导致什么未来"。
认知灵活性
PFC损伤导致认知僵化—— perseveration(持续错误反应),无法切换任务,无法抑制习惯。这是推断的灵活性丧失:系统锁定在局部最优,无法探索新的假设。
六、默认模式网络:自指的推断
当大脑"休息"时(不执行特定任务),一组区域特别活跃——默认模式网络(DMN)。包括:
内侧前额叶(自我相关思维)
后扣带回/楔前叶(情景记忆)
角回(语义整合)
外侧颞叶(社会认知)
DMN的激活是自指推断——思考自己,回忆过去,想象未来,理解他人。这是生成模型的自我采样:从自身的先验分布中生成虚构情景,训练预测能力。
心智游移与创造力
DMN支持心智游移(mind-wandering)——看似无用的思维漫游。但从活性算法角度,这是推断的探索:采样可能的假设,评估其自由能,偶尔发现低成本的创新。
创造力涉及DMN与执行网络的动态切换:DMN生成想法,执行网络评估和实现。精神疾病的网络失调(如抑郁症的DMN过度活跃,精神分裂症的整合失败)导致创造力或病态。
七、语言:共享生成模型的协议
语言是人类独特的,但神经基础是皮层的通用推断能力。语言不是专门的"语言模块",而是生成模型的社会协调。
语言作为压缩
语言压缩复杂的经验为符号序列:
词汇:离散的概念(生成模型的变量)
句法:概念间的因果关系(模型的结构)
叙事:时间序列的因果解释(推断的动态)
通过语言,个体可以传递生成模型——不仅传递事实,还传递因果结构、价值评估、情感色调。这是文化的遗传:模因作为可传递的先验。
语言习得作为推断
儿童习得语言是贝叶斯推断:
先验:先天的语言倾向(普遍语法假设)
似然:听到的语言输入
后验:习得的具体语法
关键期(童年)的高可塑性允许快速学习,之后固化(成人学习语言的困难)。
八、意识:高阶推断的自指
意识是神经科学最难的问题。活性算法提供机制性解释:意识是高阶推断的自指——系统推断自己在推断。
全局工作空间理论
Bernard Baars 的全局工作空间理论(GWT)与活性算法契合:
专用处理器(感觉、运动、记忆模块)并行工作
全局工作空间:容量有限的"广播"系统,整合信息到意识
意识内容:进入工作空间的信息
从自由能角度,工作空间是推断的整合点——多源信息竞争进入,胜者获得全局影响(最小化全局自由能)。
整合信息理论
Giulio Tononi 的整合信息理论(IIT)强调信息的整合(phi)。高phi系统(如清醒大脑)有意识,低phi系统(如睡眠、麻醉、分裂脑)无意识或意识改变。
IIT与活性算法的联系:整合信息对应生成模型的复杂度——能够区分的状态数,以及状态间的因果依赖。高整合意味着高模型复杂度,支持丰富的推断。
意识的梯度
意识不是全或无,而是梯度:
昏迷/麻醉:无整合,无推断
睡眠(NREM):低整合,低推断(离线巩固)
睡眠(REM):高整合,高生成(梦境)
清醒:高整合,高感知(现实推断)
冥想/心流:高整合,窄焦点(优化推断)
九、向第十四章的过渡
本章我们探索了新皮质——慢速层的通用推断机器。关键收获:
六层结构:微型的三层推断,预测编码的实现
皮质柱:推断的基本单元,稀疏编码,精度加权
层级预测编码:深度生成模型,双向流动,迭代优化
前额叶:高阶推断,认知控制,情景缓冲器
默认模式网络:自指推断,心智游移,创造力
语言:共享生成模型的协议,文化的遗传
意识:高阶推断的自指,全局工作空间,整合信息
但皮层不是孤立的。下一章将展示三层的耦合——快速、中速、慢速如何整合为统一的功能系统,以及这种整合如何解释精神健康和疾病。
我们将看到,意识不是皮层的产物,而是三层整合的产物——脑干的警觉,边缘系统的情感标记,皮层的叙事构建,共同创造主观体验。
准备好探索整合的奥秘了吗?
本章要点
新皮质是通用生成模型,递归层级结构支持无限展开
六层微结构:预测编码的实现,输入-整合-输出的推断
皮质柱:基本推断单元,稀疏编码,精度加权
层级预测编码:深度生成模型,双向流动,迭代优化
前额叶:高阶推断,认知控制,工作记忆,规划决策
默认模式网络:自指推断,心智游移,创造力来源
语言:共享生成模型的社会协议,文化的遗传机制
意识:高阶推断的自指,全局工作空间,整合信息
进一步思考
人工智能(如大语言模型)有类似皮层的层级结构,但缺乏三层的整合。它们有"智能"但没有"意识"?如何给AI添加边缘系统和脑干的等价物?
冥想状态(如正念、禅定)如何改变皮层功能?是增强自指(DMN活跃),还是抑制自指(DMN静默)?不同冥想类型有何差异?
如果意识是三层整合的产物,那么"上传意识"需要上传什么?不仅仅是皮层连接组,还包括与边缘系统和脑干的动态耦合?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-24 07:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社