别人成仙得道,我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

进化的奥秘:(13)新皮质——通用生成模型的无限展开

已有 216 次阅读 2026-2-23 11:05 |个人分类:我思故我在|系统分类:观点评述

第十三章:新皮质——通用生成模型的无限展开

一、褶皱的表面

    当你凝视人类大脑,最引人注目的是那个褶皱的灰色表面——新皮质。它占据大脑体积的80%,包含860亿神经元中的大部分,是进化最近的添加,被认为是智力的seat。

    但数字本身不能解释其力量。大象的脑更大,海豚的皮质更复杂,但人类创造了语言、数学、艺术、科学。差异不在于数量,而在于结构——六层组织、柱状架构、层级连接、递归自指。

    从活性算法角度,新皮质是通用生成模型的实现。它不针对特定功能(如视觉或运动),而是通用的推断机器,可以学习任何统计规律,建模任何因果结构,预测任何时间序列。这种通用性来自其递归的层级结构——每一层预测下一层,同时被上一层预测,形成自我建模的无限展开

    本章将探索这个认知的巅峰,但带着关键的警示:皮层不是孤立的巅峰,而是三层整合的顶峰。单独皮层是盲目的,正如单独脑干是机械的。

二、六层结构:微观的推断层次

    新皮质的微观结构是六层(I-VI),从表面(软脑膜侧)到深处(白质侧)。每层有特定的连接模式和功能:

    第I层(分子层)

  • 主要:来自其他皮层的远程连接(反馈)

  • 功能:整合高层预测,调制局部活动

    第II-III层(外颗粒层/外锥体层)

  • 主要:局部连接(同层),投射到其他皮层区域(前向)

  • 功能:特征提取,模式识别,信息传递

    第IV层(内颗粒层)

  • 主要:来自丘脑的感觉输入(自下而上)

  • 功能:接收观测,计算预测误差

    第V层(内锥体层)

  • 主要:投射到皮层下结构(基底神经节、脑干、脊髓)

  • 功能:输出行动,采样世界

    第VI层(多形层)

  • 主要:投射回丘脑(反馈)

  • 功能:调制输入,注意调控

    从活性算法角度,这六层是微型的三层结构

  • 输入层(IV):感知(快速)

  • 整合层(II-III):推断(中速)

  • 输出层(V-VI):行动(慢速)

    但更重要的是层级间的连接:自上而下(反馈)传递预测,自下而上(前馈)传递预测误差。这是预测编码的实现——每层生成对下一层的预测,接收来自下一层的误差,更新模型。

三、皮质柱:推断的基本单元

    皮质的功能单元皮质柱(cortical column)——直径约0.5mm、贯穿六层的垂直组织,包含约10,000神经元。每柱对应特定的感受野特征调谐(如视觉柱检测特定朝向的边缘)。

    但柱不是静态的过滤器,而是动态的推断回路

  • 基底树突(近胞体):接收前馈输入(预测误差)

  • 顶端树突(远胞体):接收反馈输入(预测)

  • 胞体:整合两者,计算后验(激活状态)

    当预测匹配输入,柱静默(误差小);当预测不匹配,柱激活(误差大),更新上层模型。这是推断的稀疏编码——只有惊讶驱动活动,节省能量,突出信息。

    微柱与超柱

    柱内部有更细的微柱(minicolumn)——约100神经元,共享特定特征。多个微柱组成超柱(hypercolumn)——覆盖完整特征空间(如所有朝向)。

    这种组织是生成模型的模块化:微柱编码特征值,超柱编码特征空间,区域编码感觉模态,整个皮层编码世界模型。

四、层级预测编码:深度生成模型

    皮质的宏观组织层级的——从初级感觉区(V1, A1, S1)到联合区(V2, V4, IT),到前额叶和顶叶的高级区。

    层级预测编码(Hierarchical Predictive Coding, HPC)是核心原理:

  • 高层生成对低层的预测("应该看到什么")

  • 低层计算预测误差("实际看到什么")

  • 误差传递到高层,更新预测

  • 预测传递到低层,解释输入

    这创造了深度生成模型

  • 低层:简单特征(边缘、颜色、音调)

  • 中层:复杂特征(形状、纹理、语音)

  • 高层:抽象概念(对象、面孔、语义)

  • 最高层:情境、意图、自我模型

    双向流动

    信息流动是双向的

  • 自上而下:预测、先验、上下文、注意

  • 自下而上:误差、新奇、细节、惊讶

    这种双向性允许推断的迭代优化:高层假设 → 低层验证 → 误差反馈 → 假设修正 → ... 直到收敛(自由能最小化)。

    精度调控

    关键机制是精度加权——不同来源的预测误差有不同的可靠性。视觉清晰时,视觉误差高权重;雾天时,视觉误差低权重,触觉或记忆高权重。

    精度由神经调质(乙酰胆碱、去甲肾上腺素、多巴胺)调控,对应注意状态(警觉、专注、学习)。这是推断的元控制——系统不仅推断世界,还推断自己的推断质量。

五、前额叶:认知控制的推断

    前额叶皮层(PFC)是最晚进化、最晚成熟的区域,负责认知控制——规划、决策、工作记忆、抑制。

    从活性算法角度,PFC是高阶生成模型的 seat

  • 工作记忆:维持在线的推断状态("当前目标是什么")

  • 规划:生成未来序列的预测("如果这样做,会发生什么")

  • 决策:评估选项的预期自由能("哪个选择最小化未来惊讶")

  • 抑制:抑制低层的不适当反应("不要执行这个习惯")

     情景缓冲器

     PFC与边缘系统(特别是海马)紧密连接,形成情景缓冲器——整合空间、时间、语义信息的在线表征。这是叙事自我的工作空间:不仅知道"现在是什么",还知道"这在什么情境中,导致什么未来"。

     认知灵活性

     PFC损伤导致认知僵化—— perseveration(持续错误反应),无法切换任务,无法抑制习惯。这是推断的灵活性丧失:系统锁定在局部最优,无法探索新的假设。

六、默认模式网络:自指的推断

    当大脑"休息"时(不执行特定任务),一组区域特别活跃——默认模式网络(DMN)。包括:

  • 内侧前额叶(自我相关思维)

  • 后扣带回/楔前叶(情景记忆)

  • 角回(语义整合)

  • 外侧颞叶(社会认知)

     DMN的激活是自指推断——思考自己,回忆过去,想象未来,理解他人。这是生成模型的自我采样:从自身的先验分布中生成虚构情景,训练预测能力。

     心智游移与创造力

     DMN支持心智游移(mind-wandering)——看似无用的思维漫游。但从活性算法角度,这是推断的探索:采样可能的假设,评估其自由能,偶尔发现低成本的创新。

    创造力涉及DMN与执行网络的动态切换:DMN生成想法,执行网络评估和实现。精神疾病的网络失调(如抑郁症的DMN过度活跃,精神分裂症的整合失败)导致创造力或病态。

七、语言:共享生成模型的协议

    语言是人类独特的,但神经基础是皮层的通用推断能力。语言不是专门的"语言模块",而是生成模型的社会协调

    语言作为压缩

    语言压缩复杂的经验为符号序列:

  • 词汇:离散的概念(生成模型的变量)

  • 句法:概念间的因果关系(模型的结构)

  • 叙事:时间序列的因果解释(推断的动态)

    通过语言,个体可以传递生成模型——不仅传递事实,还传递因果结构、价值评估、情感色调。这是文化的遗传:模因作为可传递的先验。

    语言习得作为推断

    儿童习得语言是贝叶斯推断

  • 先验:先天的语言倾向(普遍语法假设)

  • 似然:听到的语言输入

  • 后验:习得的具体语法

     关键期(童年)的高可塑性允许快速学习,之后固化(成人学习语言的困难)。

八、意识:高阶推断的自指

    意识是神经科学最难的问题。活性算法提供机制性解释:意识是高阶推断的自指——系统推断自己在推断。

    全局工作空间理论

    Bernard Baars 的全局工作空间理论(GWT)与活性算法契合:

  • 专用处理器(感觉、运动、记忆模块)并行工作

  • 全局工作空间:容量有限的"广播"系统,整合信息到意识

  • 意识内容:进入工作空间的信息

     从自由能角度,工作空间是推断的整合点——多源信息竞争进入,胜者获得全局影响(最小化全局自由能)。

     整合信息理论

     Giulio Tononi 的整合信息理论(IIT)强调信息的整合(phi)。高phi系统(如清醒大脑)有意识,低phi系统(如睡眠、麻醉、分裂脑)无意识或意识改变。

    IIT与活性算法的联系:整合信息对应生成模型的复杂度——能够区分的状态数,以及状态间的因果依赖。高整合意味着高模型复杂度,支持丰富的推断。

    意识的梯度

    意识不是全或无,而是梯度

  • 昏迷/麻醉:无整合,无推断

  • 睡眠(NREM):低整合,低推断(离线巩固)

  • 睡眠(REM):高整合,高生成(梦境)

  • 清醒:高整合,高感知(现实推断)

  • 冥想/心流:高整合,窄焦点(优化推断)

九、向第十四章的过渡

     本章我们探索了新皮质——慢速层的通用推断机器。关键收获:

  • 六层结构:微型的三层推断,预测编码的实现

  • 皮质柱:推断的基本单元,稀疏编码,精度加权

  • 层级预测编码:深度生成模型,双向流动,迭代优化

  • 前额叶:高阶推断,认知控制,情景缓冲器

  • 默认模式网络:自指推断,心智游移,创造力

  • 语言:共享生成模型的协议,文化的遗传

  • 意识:高阶推断的自指,全局工作空间,整合信息

    但皮层不是孤立的。下一章将展示三层的耦合——快速、中速、慢速如何整合为统一的功能系统,以及这种整合如何解释精神健康和疾病。

    我们将看到,意识不是皮层的产物,而是三层整合的产物——脑干的警觉,边缘系统的情感标记,皮层的叙事构建,共同创造主观体验。

    准备好探索整合的奥秘了吗?

本章要点

  • 新皮质是通用生成模型,递归层级结构支持无限展开

  • 六层微结构:预测编码的实现,输入-整合-输出的推断

  • 皮质柱:基本推断单元,稀疏编码,精度加权

  • 层级预测编码:深度生成模型,双向流动,迭代优化

  • 前额叶:高阶推断,认知控制,工作记忆,规划决策

  • 默认模式网络:自指推断,心智游移,创造力来源

  • 语言:共享生成模型的社会协议,文化的遗传机制

  • 意识:高阶推断的自指,全局工作空间,整合信息

进一步思考

  1. 人工智能(如大语言模型)有类似皮层的层级结构,但缺乏三层的整合。它们有"智能"但没有"意识"?如何给AI添加边缘系统和脑干的等价物?

  2. 冥想状态(如正念、禅定)如何改变皮层功能?是增强自指(DMN活跃),还是抑制自指(DMN静默)?不同冥想类型有何差异?

  3. 如果意识是三层整合的产物,那么"上传意识"需要上传什么?不仅仅是皮层连接组,还包括与边缘系统和脑干的动态耦合?



https://wap.sciencenet.cn/blog-41701-1523094.html

上一篇:进化的奥秘:(12)边缘系统——情绪作为快速推断的近似
下一篇:进化的奥秘:(14)三层耦合——跨尺度的共振与涌现
收藏 IP: 111.27.42.*| 热度|

4 聂广 郑永军 崔锦华 宁利中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-2-23 15:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部