博文

进化的奥秘：（13）新皮质——通用生成模型的无限展开

已有 216 次阅读 2026-2-23 11:05 |个人分类:我思故我在|系统分类:观点评述

第十三章：新皮质——通用生成模型的无限展开

一、褶皱的表面

当你凝视人类大脑，最引人注目的是那个褶皱的灰色表面——新皮质。它占据大脑体积的80%，包含860亿神经元中的大部分，是进化最近的添加，被认为是智力的seat。

但数字本身不能解释其力量。大象的脑更大，海豚的皮质更复杂，但人类创造了语言、数学、艺术、科学。差异不在于数量，而在于结构——六层组织、柱状架构、层级连接、递归自指。

从活性算法角度，新皮质是通用生成模型的实现。它不针对特定功能（如视觉或运动），而是通用的推断机器，可以学习任何统计规律，建模任何因果结构，预测任何时间序列。这种通用性来自其递归的层级结构——每一层预测下一层，同时被上一层预测，形成自我建模的无限展开。

本章将探索这个认知的巅峰，但带着关键的警示：皮层不是孤立的巅峰，而是三层整合的顶峰。单独皮层是盲目的，正如单独脑干是机械的。

二、六层结构：微观的推断层次

新皮质的微观结构是六层（I-VI），从表面（软脑膜侧）到深处（白质侧）。每层有特定的连接模式和功能：

第I层（分子层）

主要：来自其他皮层的远程连接（反馈）
功能：整合高层预测，调制局部活动

第II-III层（外颗粒层/外锥体层）

主要：局部连接（同层），投射到其他皮层区域（前向）
功能：特征提取，模式识别，信息传递

第IV层（内颗粒层）

主要：来自丘脑的感觉输入（自下而上）
功能：接收观测，计算预测误差

第V层（内锥体层）

主要：投射到皮层下结构（基底神经节、脑干、脊髓）
功能：输出行动，采样世界

第VI层（多形层）

主要：投射回丘脑（反馈）
功能：调制输入，注意调控

从活性算法角度，这六层是微型的三层结构：

输入层（IV）：感知（快速）
整合层（II-III）：推断（中速）
输出层（V-VI）：行动（慢速）

但更重要的是层级间的连接：自上而下（反馈）传递预测，自下而上（前馈）传递预测误差。这是预测编码的实现——每层生成对下一层的预测，接收来自下一层的误差，更新模型。

三、皮质柱：推断的基本单元

皮质的功能单元是皮质柱（cortical column）——直径约0.5mm、贯穿六层的垂直组织，包含约10,000神经元。每柱对应特定的感受野或特征调谐（如视觉柱检测特定朝向的边缘）。

但柱不是静态的过滤器，而是动态的推断回路：

基底树突（近胞体）：接收前馈输入（预测误差）
顶端树突（远胞体）：接收反馈输入（预测）
胞体：整合两者，计算后验（激活状态）

当预测匹配输入，柱静默（误差小）；当预测不匹配，柱激活（误差大），更新上层模型。这是推断的稀疏编码——只有惊讶驱动活动，节省能量，突出信息。

微柱与超柱

柱内部有更细的微柱（minicolumn）——约100神经元，共享特定特征。多个微柱组成超柱（hypercolumn）——覆盖完整特征空间（如所有朝向）。

这种组织是生成模型的模块化：微柱编码特征值，超柱编码特征空间，区域编码感觉模态，整个皮层编码世界模型。

四、层级预测编码：深度生成模型

皮质的宏观组织是层级的——从初级感觉区（V1, A1, S1）到联合区（V2, V4, IT），到前额叶和顶叶的高级区。

层级预测编码（Hierarchical Predictive Coding, HPC）是核心原理：

高层生成对低层的预测（"应该看到什么"）
低层计算预测误差（"实际看到什么"）
误差传递到高层，更新预测
预测传递到低层，解释输入

这创造了深度生成模型：

低层：简单特征（边缘、颜色、音调）
中层：复杂特征（形状、纹理、语音）
高层：抽象概念（对象、面孔、语义）
最高层：情境、意图、自我模型

双向流动

信息流动是双向的：

自上而下：预测、先验、上下文、注意
自下而上：误差、新奇、细节、惊讶

这种双向性允许推断的迭代优化：高层假设 → 低层验证 → 误差反馈 → 假设修正 → ... 直到收敛（自由能最小化）。

精度调控

关键机制是精度加权——不同来源的预测误差有不同的可靠性。视觉清晰时，视觉误差高权重；雾天时，视觉误差低权重，触觉或记忆高权重。

精度由神经调质（乙酰胆碱、去甲肾上腺素、多巴胺）调控，对应注意状态（警觉、专注、学习）。这是推断的元控制——系统不仅推断世界，还推断自己的推断质量。

五、前额叶：认知控制的推断

前额叶皮层（PFC）是最晚进化、最晚成熟的区域，负责认知控制——规划、决策、工作记忆、抑制。

从活性算法角度，PFC是高阶生成模型的 seat：

工作记忆：维持在线的推断状态（"当前目标是什么"）
规划：生成未来序列的预测（"如果这样做，会发生什么"）
决策：评估选项的预期自由能（"哪个选择最小化未来惊讶"）
抑制：抑制低层的不适当反应（"不要执行这个习惯"）

情景缓冲器

PFC与边缘系统（特别是海马）紧密连接，形成情景缓冲器——整合空间、时间、语义信息的在线表征。这是叙事自我的工作空间：不仅知道"现在是什么"，还知道"这在什么情境中，导致什么未来"。

认知灵活性

PFC损伤导致认知僵化—— perseveration（持续错误反应），无法切换任务，无法抑制习惯。这是推断的灵活性丧失：系统锁定在局部最优，无法探索新的假设。

六、默认模式网络：自指的推断

当大脑"休息"时（不执行特定任务），一组区域特别活跃——默认模式网络（DMN）。包括：

内侧前额叶（自我相关思维）
后扣带回/楔前叶（情景记忆）
角回（语义整合）
外侧颞叶（社会认知）

DMN的激活是自指推断——思考自己，回忆过去，想象未来，理解他人。这是生成模型的自我采样：从自身的先验分布中生成虚构情景，训练预测能力。

心智游移与创造力

DMN支持心智游移（mind-wandering）——看似无用的思维漫游。但从活性算法角度，这是推断的探索：采样可能的假设，评估其自由能，偶尔发现低成本的创新。

创造力涉及DMN与执行网络的动态切换：DMN生成想法，执行网络评估和实现。精神疾病的网络失调（如抑郁症的DMN过度活跃，精神分裂症的整合失败）导致创造力或病态。

七、语言：共享生成模型的协议

语言是人类独特的，但神经基础是皮层的通用推断能力。语言不是专门的"语言模块"，而是生成模型的社会协调。

语言作为压缩

语言压缩复杂的经验为符号序列：

词汇：离散的概念（生成模型的变量）
句法：概念间的因果关系（模型的结构）
叙事：时间序列的因果解释（推断的动态）

通过语言，个体可以传递生成模型——不仅传递事实，还传递因果结构、价值评估、情感色调。这是文化的遗传：模因作为可传递的先验。

语言习得作为推断

儿童习得语言是贝叶斯推断：

先验：先天的语言倾向（普遍语法假设）
似然：听到的语言输入
后验：习得的具体语法

关键期（童年）的高可塑性允许快速学习，之后固化（成人学习语言的困难）。

八、意识：高阶推断的自指

意识是神经科学最难的问题。活性算法提供机制性解释：意识是高阶推断的自指——系统推断自己在推断。

全局工作空间理论

Bernard Baars 的全局工作空间理论（GWT）与活性算法契合：

专用处理器（感觉、运动、记忆模块）并行工作
全局工作空间：容量有限的"广播"系统，整合信息到意识
意识内容：进入工作空间的信息

从自由能角度，工作空间是推断的整合点——多源信息竞争进入，胜者获得全局影响（最小化全局自由能）。

整合信息理论

Giulio Tononi 的整合信息理论（IIT）强调信息的整合（phi）。高phi系统（如清醒大脑）有意识，低phi系统（如睡眠、麻醉、分裂脑）无意识或意识改变。

IIT与活性算法的联系：整合信息对应生成模型的复杂度——能够区分的状态数，以及状态间的因果依赖。高整合意味着高模型复杂度，支持丰富的推断。

意识的梯度

意识不是全或无，而是梯度：

昏迷/麻醉：无整合，无推断
睡眠（NREM）：低整合，低推断（离线巩固）
睡眠（REM）：高整合，高生成（梦境）
清醒：高整合，高感知（现实推断）
冥想/心流：高整合，窄焦点（优化推断）

九、向第十四章的过渡

本章我们探索了新皮质——慢速层的通用推断机器。关键收获：

六层结构：微型的三层推断，预测编码的实现
皮质柱：推断的基本单元，稀疏编码，精度加权
层级预测编码：深度生成模型，双向流动，迭代优化
前额叶：高阶推断，认知控制，情景缓冲器
默认模式网络：自指推断，心智游移，创造力
语言：共享生成模型的协议，文化的遗传
意识：高阶推断的自指，全局工作空间，整合信息

但皮层不是孤立的。下一章将展示三层的耦合——快速、中速、慢速如何整合为统一的功能系统，以及这种整合如何解释精神健康和疾病。

我们将看到，意识不是皮层的产物，而是三层整合的产物——脑干的警觉，边缘系统的情感标记，皮层的叙事构建，共同创造主观体验。

准备好探索整合的奥秘了吗？

本章要点

新皮质是通用生成模型，递归层级结构支持无限展开
六层微结构：预测编码的实现，输入-整合-输出的推断
皮质柱：基本推断单元，稀疏编码，精度加权
层级预测编码：深度生成模型，双向流动，迭代优化
前额叶：高阶推断，认知控制，工作记忆，规划决策
默认模式网络：自指推断，心智游移，创造力来源
语言：共享生成模型的社会协议，文化的遗传机制
意识：高阶推断的自指，全局工作空间，整合信息

进一步思考

人工智能（如大语言模型）有类似皮层的层级结构，但缺乏三层的整合。它们有"智能"但没有"意识"？如何给AI添加边缘系统和脑干的等价物？
冥想状态（如正念、禅定）如何改变皮层功能？是增强自指（DMN活跃），还是抑制自指（DMN静默）？不同冥想类型有何差异？
如果意识是三层整合的产物，那么"上传意识"需要上传什么？不仅仅是皮层连接组，还包括与边缘系统和脑干的动态耦合？

转载本文请联系原作者获取授权，同时请注明本文来自王涛科学网博客。
链接地址：https://wap.sciencenet.cn/blog-41701-1523094.html

上一篇：进化的奥秘：（12）边缘系统——情绪作为快速推断的近似
下一篇：进化的奥秘：（14）三层耦合——跨尺度的共振与涌现

收藏 IP: 111.27.42.*| 热度|

当前推荐数：4 推荐人：聂广 郑永军 崔锦华 宁利中

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

王涛

扫一扫，分享此博文

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

进化的奥秘：（13）新皮质——通用生成模型的无限展开

当前推荐数：4 推荐人：聂广 郑永军 崔锦华 宁利中

该博文允许注册用户评论请点击登录评论 (0 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

进化的奥秘：（13）新皮质——通用生成模型的无限展开

当前推荐数：4 推荐人： 聂广 郑永军 崔锦华 宁利中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

当前推荐数：4 推荐人：聂广郑永军崔锦华宁利中

该博文允许注册用户评论请点击登录评论 (0 个评论)