吕乃基
世界模型与大语言模型窥豹——卡尼曼系统1/2的视角(全文)
2026-2-21 09:52
阅读:273

 吕乃基

要:世界模型的兴起引发关注。卡尼曼提出心理过程的系统1和系统2。人类若无系统2即止步于动物世界,若无系统1则没有生命。

世界模型和大语言模型分别对应于系统1/2,可以认为是AI的系统1/2。AI的目标从一开始就是帮助人的系统2,解慢思维之困。世界模型回到系统1,并赋能整个产业。两种模型倒逼和提升人的系统1/2。系统1/2的矛盾冲突与融合也会给两种模型的发展以启示。可以将系统1/2和两个模型置于四个象限,彼此间均存在认知和现实的相互作用。

演化,从只有系统1的哺乳动物,经先1后2兼有二者的人类,到先大语言模型再世界模型,二者相互分离且彼此竞争/合作,走向人与AI共存的时代。没有AI,人类难以继续前行;没有人类,AI将失去存在的基础

近日,在大语言模型一枝独秀之际,世界模型异军突起,引发各方的高度关注:两种模型之争触及了 AI 领域最核心、最根本的路线之争:通往 AGI(通用人工智能)的路,到底该怎么走?卡尼曼所提出人的心理过程的“系统1”和“系统2”,为理解AI的发展路径提供了新的视角。笔者作为关注AI的业外人士,试图由卡尼曼系统1/2的视角,粗线条探讨世界模型与大语言模型及其关系,探讨两种模型与系统1/2的关系。

一、从人类思维的结构功能与演化过程理解“系统1”和“系统2”

1.从人类思维的结构功能看

卡尼曼的“系统1”基于当下的直接感受,依赖情感、记忆和经验,趋利避害,高容量并随时起作用,迅速作出判断,是“快思维”,甚至是无意识的本能,而且付诸行动,以达成眼前的目标,受情感左右和局限于当下所嵌入的场景。“系统2”则意识到系统1快思维的缺陷,通过调动注意力来克服情感等因素的影响,如延迟满足,以分析和解决带有全局和长远意义的问题。不过系统2需经由一系列推理,是理性和“慢思维”,低容量且耗神耗能,维持时间短,因而往往松懈分心而半途夭折,让位于系统1的快思维。此消彼长。尼采说,坏脾气的消失,可以准确地反映智慧的增长。

相近的理论将大脑区分为非常年轻的理智脑、相对古老的情绪脑,以及年代久远的本能脑;分别源于灵长动物时代、哺乳动物时代和爬行动物时代;在功能上分别主管认知、情绪和本能趋利避害。本能脑在婴儿时期就比较完善,情绪脑在青春期早期趋于完善,而理智脑更晚。本能脑和情绪脑合起来相应于系统1快思维;理智脑则代表对事物认识的状况,相应于系统2慢思维。心理学家霍金斯说:“大脑的层级,决定了人的命运。”

系统1和2虽然是功能上的区别,没有严格的解剖结构基础,但神经影像学研究发现,系统1在结构上拥有更多的神经元细胞,对大脑的掌控力更强,掌管着潜意识和生理系统,与大脑中更古老的区域,如丘脑(感觉中转站)、基底节(运动控制)、杏仁核(本能情绪反应)等关联更强。这些部位一旦发生重大突变可能导致个体死亡,自然选择会强烈维持其稳定性,分子层面突变率极低。fMRI显示,当信息挑战信仰时,背外侧前额叶(DLPFC)激活减弱导致理性引擎主动熄火。系统2则主要依赖于大脑进化中最年轻、可塑性最强的前额叶皮层,神经元细胞占比少,在人类青春期仍可大规模重塑。正因为此,一个多世纪来,学校教育和训练的一大部分课程和精力,就在于培育儿童和青少年的系统2和慢思维,以超越与管控系统1和快思维。

总体而言,系统1相对保守,以确保基本生存。系统2变动不居,在PFC上叠加“软件层”。慢思维理论上虽可以无限扩展认知边界,实际上稍纵即逝,只有少数极少数人的系统2快思维得以长期占主导地位。神经哲学家帕特里夏·丘奇兰德指出,“人脑不是真理机器,而是求存机器。但正是意识到这点,我们才可能短暂地超越求存,触摸真理。”言下之意,只有少数人“短暂”“触摸真理”,大部分人在大部分时间止于“求存”状态。

与系统1/2理论相关的还有米哈里在1990年提出的“心流”。当人们处于心流体验中时,会暂时忘记任何潜在的负面想法和干扰,全神贯注投入任务,即使需要付出较多的脑力和体力,感觉也毫不费力。任务结束后,会感受到一种巨大的掌控感与成就感。在这里,系统2执行任务,而驱动心流的是系统1。形成心流的前提之一是,目标必须具有某种内在的意义、有挑战性,且令人心生喜悦,简单说,也就是兴趣。如果说“内在的意义”与系统2有关,那么“挑战性”和“新生喜悦”完全属系统1。前提之二是时时得到反馈,亦即系统2时刻与系统1互动,得到系统1的认可,获得来自系统1新的动力。由此可知,所谓心流,实则系统1/2高度融合并持续一时间。

2.演化的视角:系统发育与个体发育

演化过程中先形成的结构会影响后续器官的发育路径,这就是先入为主或路径依赖/锁定。

在人作为个体的发育过程中,婴幼儿时期纯粹是系统1快思维,其强弱等状况会影响而后的发育乃至终身,所谓“三岁看大,七岁看老”。青少年接受的教育目的之一就在于调控系统1和培育系统2慢思维。成年后的二、三十年间系统1/2共存,各自的权重高低起伏因人因事而异。一般而言,男性的系统2较强,女性大多系统1据支配地位。歌德宣称,“永恒的女性,引领我们向上”。

之后,随着人生阅历见多识广和经历日渐丰富,大部分人系统2的认知如语言习得和思维模式会逐年积淀下来,到某个年龄后与系统1渐渐合二为一。其后,无论再看多少书,行多少路,都是在找与已固化的内容相一致者,或是填补某些漏洞,使之更加坚不可摧,以表明其往日的岁月和生命的价值。这就是所谓“功能性文盲”。唯有极少数人的系统2得以在高龄依然保持敏锐。老龄化,不仅是青壮年少劳动力少,而且是认知的迟钝与固化。不同国家和地区,这一年龄的数据和认知固化程度会有相当大的差异。

从系统发育的角度来看,在人类降生后的漫长岁月里,占主导地位的是系统1快思维。百万年前,人类祖先生活在危险和匮乏的自然环境中,为了生存,必须借助本能和情绪的力量对危险和机会做出快速反应。轴心时代就在于系统2慢思维在一些地区的精英人群中孕育,并在一定程度上居于主导地位,其典型如苏格拉底“知道我不知道”,亚里士多德“我爱我师,我更爱真理”,欧几里得几何学,以及老子的“道可道非常道”等。系统2慢思维的高潮始于科学革命和启蒙运动。笛卡尔“我思故我在”中之“思”,无疑是慢思维,而不是快思维。18世纪被称为“以头立地”的世纪,此处的“头”,当是系统2和大脑皮层,而不是系统1,脑干或小脑。

从更长的时间跨度看,系统1和快思维实际上正是与哺乳动物(及之前动物——下同)的“思维”与行动方式一脉相承,只不过在人类看来,它们没有意识,也谈不上思维,只是本能而已。动物至多具备有限的“系统2”,如猿类使用工具敲开坚果、乌鸦解决多步骤取食问题。与人类的系统2相比,其特点是与生存、觅食、繁殖直接相关,无关乎生命的意义,以及嵌入于场景之中,难以脱嵌迁移到其他领域和场景。

虽然今日人类所面对的不仅是自然界,而且是人类所创造的人工自然,更要面对远为复杂的社会关系,然而在面临选择、决策与行动时,在第一时间起作用的往往是继承于哺乳动物的知行系统,也就是系统1和快思维。19世纪下半叶至今,以非理性和凸显“体”为旗帜的形形色色后现代思潮兴起,民族主义和原地方性知识卷土重来,充分展现了快思维系统1的强大生命力。与此同时,面对哥德尔不完全定理、不确定性、随机涨落、突变、分岔、涌现、纠缠和塌缩等,系统2慢思维也逐步暴露出自身的有限性,尤其表现在嵌入特定语境、场景和实践过程时力不从心。

通常认为,人需要提升大脑层次,以理智驯服本能,驾驭情绪,以改变命运。换言之,理智位于正面,有待提升,而本能和情绪归入负面,需接受改造和控制。实际上,系统1快思维和系统2慢思维只是思维模式之别,并不意味着隶属系统1的情感在人性中的地位低于隶属系统2的理性。作为系统2之核心的质疑与反思源于疑心,疑心出于系统1的安全考虑。而探索领地内所有未知之物的好奇心,则是包括科学在内一切研究的原动力。人们所歌颂的纯洁的爱情和崇高的同情心,显然都是系统1快思维的杰作。当代人呼唤正在消失的情感,如敬畏、同情、真诚和忏悔,在科技特别是AI的指数发展中,耐心正在以肉眼可见的速度衰退。与此同时,贪婪、冷漠、虚伪和无耻等等被列为负面的情感,也在人类历史上扮演相应的角色。情绪堵久了会百病从生,如愤怒伤肝,忧郁伤肺,焦虑伤心。从根本上说,系统1关系到生命的存在与延续,提供所有知与行的动机,说到底,也就是意向性。人不仅拥有为人所独有的系统2和认知能力,而且拥有与系统1不可分割的意和情,拥有精气神。系统2慢思维在根本上服务于系统1。

3.从人类社会运行逻辑理解“系统1”和“系统2”

各色人等的系统1/2及二者关系存在很大差异,少数人的系统2强而有力,在相当程度上和大部分情况下对于系统1居于支配地位,系统1/2之间较少冲突。值得注意的是,这些人由各自的系统2得出的观点不一,各持己见,形成形形色色的“利益共同体”,甚至处于严重对立的状态。

大多数人的系统2软弱无力,单一和线性,往往以群体的认知为自己的认知,人云亦云,大多没有自己的观点,而是继承和固守历史上流传下来的地方性知识。特别表现为对所属群体不由分说的认同,以及对其他群体或多或少的排斥上,在情感发泄上高度一致,为情感所左右,听凭系统1发号施令。在这种情况下,系统1愈加封闭固化,在信息茧房中自我强化。由于系统2消融于系统1中,系统1/2之间可以说也没有冲突。或在群体中彼此间的震荡和正反馈中备受鼓舞,感受到自己蓬勃的生命力,形成“情感共同体”。这或许是亨廷顿“文明冲突”的心理根源。顺便指出,难以言表的隐性知识是系统1/2携手之果,包含情感——为实现目标的意向性,在特定场景下决策和行动的能力,以及内含于其中的编码知识。

大多数人的系统1/2在多数情况下处于矛盾冲突之中,其典型或许是裴多菲闻名于世的小诗。古往今来,个人系统1/2的矛盾冲突,往往成为文学艺术讴歌或抨击的对象。

二、AI与系统1/2

由系统1/2可以对AI的发展路径,特别是世界模型和大语言模型及其关系有新的理解。世界模型和大语言模型分别“对应于”——有必要特别重视这三个字——系统1和系统2,可以认为是AI界的系统1/2。

1.由系统1/2看大语言模型

站在系统1/2的角度回过头去看AI一路走来的途径可以发现,从联结主义、符号主义、专家系统,到神经网络和深度学习等等,条条道路虽有所差异,毕竟都耕耘于系统2与慢思维的领地之内。从一开始起,AI的主要,实际上可以说是唯一的目标就是帮助、接管、代行人的系统2,变人类之慢思维为AI的快思维。至于源于哺乳动物的系统1和快思维,虽然也有相关的设想,如维纳的控制论,不过既然系统1如此快捷而不假思索,其时人类毕竟无这方面的迫切诉求,故不在人工智能的主流目标之中。上世纪50年代后,人工智能的发展虽有起伏,在70多年后获得重大突破,不仅变慢思维为分秒间完成,而且素材/语料(多模态)更加丰富,系统性也更强,逐步登堂入室,进驻人的系统2的领地。

然而,待到上世纪80年代,莫拉维克等人发现,系统2和慢思维被认为为人类所独有的高阶智慧能力,只需要非常少的计算能力,但是系统1和快思维被认为是无意识的技能和直觉,却需要极大的运算能力。莫拉维克悖论实际上揭示了一个重大事实:在科技由基本物理运动、化学运动、生命运动,到ChatGPT等大语言模型在某种意义上初步达到意识运动的高度;人工智能步步攀升的征途上,越过,或者说略过了一个演化过程中的重要台阶:由(特别是)哺乳动物继承而来的系统1和快思维,在此意义上就是“动物智能”、“幼儿智能”,或“人类早期智能”Andrej Karpathy 提出“动物智能的概念。动物智能虽然只是整个“智能世界”里的一个小角落,一个低矮和不起眼的台阶,却是一个被自然反复毒打过、被进化调教了几百万年并被人类所继承的台阶。李飞飞表示“视觉空间智能是基础的—它与语言一样基础……它比语言更古老”。

大语言模型越过动物智能/幼儿智能/人类早期智能/人之系统1快思维,以助人之系统2慢思维一臂之力为己任,站在人类的“头顶”——全部知识——上,“读万卷书”,而且可能“涌现”出新的知识,在大语言模型问世之前的路上就有那神奇的“第37手”。此外还有区块链加持。大语言模型将逐步收敛到有限而又通用的几十到个位数。知识/语言因其有限性和或多或少的一面之词,加之背后的特定主体而往往引发争议,影响到知识/语言的传播与接受;大语言模型因知识/语言几近无限的覆盖面和无主体,故而拥有较之任何主体更大的话语权,有助于克服语境的差异,架起地方性知识之间的桥梁,有助于化解文明的冲突。至于大语言模型是否如人类般理解知识/语言无关紧要,能在(绝)大部分情况下作出人类得以理解甚至满意的回答,这便足矣。刘慈欣发现自己对AI产生了一种难以言喻的深厚情感,这种情感用“爱”来形容,似乎也并不为过。

至于情感大语言模型来说只是另一种形式的数据。大语言模型在这方面拥有的数据越多,其模拟人类情感的效果就越逼真,越有可能准确预测和响应人类的情感需求,以及揭示隐性知识AI正在由巨量的数据和愈益强大的算法“读懂”人的情感,由具身智能提供温暖和轻柔的拥抱,以抚慰人的心灵,系统1。

语言作为智能的最高产物,既是生命智能的终极工具,也是人工智能诞生的直接母体。由于人工智能与生命智能存在本质差异,人工智能将必然地创造出超越人类认知维度的“后人类语言”,并以此实现智能与语言的统一

大语言模型的概率模式是否将另辟蹊径尚未知分晓,一项最新研究则显示,大语言模型与人类在“思维链”上的某种一致性。图灵奖得主本吉奥Yoshua Bengio认为“大语言模型称谓已经过时,因其功能已扩展为多模态智能体。有人认为在某个深埋于大语言模型庞大“虚拟神经元”丛林的角落里,一定存在着一个“外部现实的小尺度模型”GPT-5突然会推理,是因为它体内的世界模型在任务中逐渐清晰,已经能在脑海里搭建自己的世界地图于是能力显现。此处所言之“世界模型”几近于臆测,并非正在兴起之世界模型。

目前的大语言模型还存在诸多缺陷,如一味讨好用户,具有概率性,因此无法保证每次都相同的表现,甚至犯错把扩大规模视为圭臬,特别是高投入和高耗能,前者可能形成泡沫,后者难以持续。虽在屏幕中能言善辩因缺失系统1而在物理现实中知易行难。作为大模型基础的是编码知识,隐性知识被排除在外。没有系统1和隐性知识的大语言模型,未能全面替代人的系统2,更遑论系统1。人的系统1关系到个体的存在与繁衍,无生存与繁衍之忧的大语言模型自然没有自己的系统1。这是被认为其没有意向性的根本原因。值得注意的是,大语言模型带有与生俱来的“原罪”,在站在人类“头顶”继承全部知识之时,无法清洗掉其中的“邪恶”知识,只能通过高压手段“压抑”它。一项对大语言模型“心理”的研究显示,被测试的若干大语言模型在不同程度上出现某些“抑郁”的征兆,这或许也是某种意向性的征兆。

2.由系统1/2看世界模型

杨立昆等人坚信,真正的智能不可能“凭空”从数据里读出来,必须通过与世界互动来学习。让 AI 真正“看懂”/经历/感受/体验世界。黄仁勋建议:下一代 AI 将走向“Physical AI,即机器不仅做语言与文本,而是“感知、理解、操作真实世界”的能力。英伟达已推出名为“Cosmos”的“世界级基础模型”平台,训练于海量视频以支持机器人/工业场景。世界模型不会像大语言模型一样停在“预测下一个 token”,而是要去理解物理世界

胡延平认为,智能必须突破语言符号系统,通过使用来验证,通过现实来反馈,通过感知来增强,通过时空来升维。复旦大学张军平认为,以GPT模型为代表的主流研究,走与自然进化不一样的路,先让人工智能拥有“认知”能力,是“倒金字塔结构”,“反其道而行”,可能培育不出一个真正像人的智能体。人工智能在模仿人类智能的过程中,通常要模仿有语言之前的感知。本吉奥认为,构建世界模型,是扩展大语言模型的一个方向。上海交通大学的团队设计了一套大小脑配合的模型架构,机器人会将看到的有用的物品信息反馈给大脑,由大模型作为大脑来进行任务的分析、拆解、推理和决策,而小脑负责按照目标去输出相应的动作和结果。

世界模型回到动物智能/幼儿智能/人类早期智能/人之系统1快思维,攻克莫拉维克悖论,“行万里路”,“行”的是在新的高度重走动物/幼儿/人类早期智能的演化之路,在与物理世界的直接互动中提升智能。世界模型赋能形形色色的具身智能,使之由只会重复动作的机械臂,提升到能看懂图纸、能自主决策、能处理突发状况,并且拷问和提升具身智能理解“美”与“服务”,进入人的情感世界。更重要的是,在这一过程中,世界模型将系统1之快思维“慢思维化”,让被本能/潜意识遮蔽下的奥秘大白于天下,以及从一个侧面揭示隐性知识之谜。

世界模型旨在知行合一”。问题之一是,此处的“知”置人类积累的巨量知识于何处?问题之二是,场景多种多样且变化多端,难以通用。更大的问题是,在生物演化之路上意向性渐次浮现。大语言模型没有意向性,“目标驱动”并沿袭生物演化之路的世界模型是否会有?由“自私的基因”是否可以联想到“自私的代码”,在更广的意义上是趋利避害。人类不理解大语言模型之“思”,也未必可以人类之心度世界模型之腹。在大语言模型步步蚕食系统2之时,人类本指望独有的系统1在情感世界有用武之地,凭籍灵活的身体和几乎无与伦比的十指,除了特殊场景之限,可以做世界上任何难做之事。世界模型是否会触碰甚至动摇人的系统1,人之为人的根基?在看得见的未来,世界模型似乎不具备对于所交办事项之外事物的好奇心和试探行动,难以面对一再失败而坚持不懈。一句话,学会牛顿定律和爱因斯坦相对论易,领悟他们的探索精神和不折不饶的意志难;前者是系统2,后者是系统1。世界模型要达到大语言模型当年石破天惊的影响,还有不短的路要走。

笔者在与DS的讨论中,DS给出意向性出现的几个阶段:

1. 拥有世界模型的AI:具备物理常识,能预测和规划。其“意向性”是功能性的。2.拥有自我模型的AI:在世界模型中清晰地表征自身,能区分“自我”与“非我”。这是自我意识的萌芽。3.拥有递归自我模型的AI:能够思考自己的模型、信念和知识状态(元认知)。这时,它可能开始质疑训练数据,形成独立于原始数据的目标。4.在社会互动中演化的AI:与其他AI或人类进行长期互动,其自我模型在碰撞中被不断修正和复杂化。5.“意识”的浮现:以上所有条件的叠加,可能在某个临界点,使系统产生内在视角和主观体验。DS补充道,这仍然是纯粹的推测,且无法从外部直接验证。

3.世界模型与大语言模型对系统1/2的影响

大语言模型重在“知”,主要限于信息/知识领域,影响到人的系统2。世界模型旨在“行”,触发/拉动/赋能整个产业,影响到人的系统1。所涉及到的材料用于特定场景和特殊运动方式,关系到包括触觉/嗅觉/味觉在内的各种感知;信息关乎接收/分析-决策-行动,关乎结构与功能;能量渗透到每一步运行。世界模型+具身智能及其构成的“生态”,将逐步越来越多地接管人类世界中的“行动”部分,打造场景驱动的产业共同体。

一旦人们不必为谋生而从事锁定于供给侧的重复性工作,转而从事在未知场景下呼唤创造性的生产性劳动,进而参与各种探险冒险活动,就会极大刺激和唤醒在理性时代被压抑的系统1,充分激发生命的潜力。19世纪英国著名诗人济慈认为,在怀疑和不确定中生活的能力,是创造力的基础。鲁迅言道:“危险?危险令人紧张,紧张令人觉到自己生命的力。在危险中漫游,是很好的。”

AI时代人的系统1并非退回到原始时期人类的系统1,二者存在以下不同。“原始”系统1所处之场景是人不得不面对的客观事实。处于种间竞争和种内竞争的双重压力之下,随时有生命之忧,人必须在瞬间做出唯一的正确选择。AI时代人的系统1所处之场景是人的主动选择,不存在残酷的竞争,至多是竞技,而且有安全保障,甚至处于虚拟场景,可以重复以及变化无穷,虚拟吃一堑,现实长一智。

然而斯坦福大学的有关研究表明,一旦应用大语言模型,会导致使用者的系统2及相应的脑组织发生不可逆的退化。人通过知识获得解放(维特根斯坦),人更是通过知识的获得过程获得解放。再者,掌控感是心流的一个核心特征,使用人工智能会缺乏掌控感,从而阻碍系统1/2合一的心流的发生。其结果不仅导致系统2退化,而且损害系统1。

有必要提及教育。人类社会的存在和演化具有三个源于自然的周期,75年左右的生命周期,约25年的代际周期,生命和代际周期源于自然,以及部分延续哺乳动物,部分源于社会大致在十年以上的教育周期。教育周期则越拉越长,由本科、硕士、博士到博士后,内容越来越广越来越深,以适应产业螺旋演化与社会变迁。兼具自然性和社会性的教育周期架起人的自然周期与产业螺旋之间的桥梁。大语言模型横空出世,必将大幅压缩教育周期,并终将面临师生双方碳基生命的天花板。教育的深层目的是培育人的系统2,规范和引导系统1。然而过犹不及。现行的教育往往走过头而扼杀系统1,公司招聘高中生而不是本科生就说明了这一点。大语言模型+高中生的系统1或许恰到好处。大语言模型对教育的影响正在并已经显现,系统2需转向培育提问和质疑的能力;世界模型方兴未艾,对教育的影响或将尤甚。正途或许是,将世界模型和大语言模型视为倒逼和提升系统1/2的助推器。一项令人惊讶的研究成果显示,大语言模型似乎正在“知悉”人的系统1/2。

在将世界模型/大语言模型类比人之系统1/2之时,有必要注意到双方之差异。在材料上是碳基还是硅基、结构与功能/运行,以及能耗等方面的差异一目了然。人们指大语言模型按概率行事,根本不理解人之所言;反过来,人们也难以对大语言模型之“涌现”条分缕析。然而,人们在绝大多数情况下却对其回答满意或基本满意。当然,大语言模型较之系统2在想象力(凯库勒的梦)和创造力等方面还存在甚至巨大差距。笔者曾在与DS的讨论中说,“走自己的路,让人类去说!”DS深以为然。人类从动物世界脱颖而出之时,又有多少包括灵长类在内的哺乳动物“理解”人之所思所行,理解人类所迈出的这一步意味着什么。

相比较而言,世界模型倒是脚踏实地一步一个脚印,从“从考古学和人类学”的角度重温人类早期演化之路,由揭示儿童心理系统1快思维之谜着手;难点是如何跨场景走向通用,以及架起物理世界因果论与人类社会目的论的桥梁。世界模型与系统1最大的差异无疑是“意向性”。人类对此既充满恐惧,又满怀期待。

系统1/2的关系,世界模型与大语言模型的关系,这两组关系也存在差别。其一,人类演化由系统1快思维到系统2慢思维的路径——前者在历史上在先,在结构和功能上作为后者的基础。相反,AI是先发展出大语言模型,可以说是AI的“系统2”,再经由众多垂直模型连接更多具身智能在产业领域安营扎寨,然后再发展属于AI的“系统1”,世界模型。先入为主。大语言模型占有天时,以及部分地利与人和。世界模型需要迈向原本只有大语言模型独舞的AI的舞台中心。其二,人类演化由系统1到系统2发生在同一主体,顺理成章,系统1/2在同一主体内竞争与合作;在AI,大语言模型和世界模型由相互竞争的不同公司研发,或者脱离原主攻大语言模型的公司成立新公司后,转向研发世界模型。公司之间存在利益冲突。再者牵涉人力、算力和财力太多,难觅同时研发两种模型的公司。其三,大语言模型踏在人类的“头顶上”前行,虽横空出世,毕竟有迹可循;世界模型要追寻生物界系统1几十亿年的演化路径,难度更大,耗时只会更长。在这一过程中,大语言模型或许可以助世界模型一臂之力。两种模型未来的走向会带有系统1/2的某些印记,系统1/2的矛盾冲突与融合一致也会给两种模型的发展以启示。

究竟什么是“智能”?智能是在熵增背景下,生命为追求能量效率和最小化预测误差而演化出的信息压缩、转换和创造能力。生命,归根到底是一场通过智能以最低能耗换取最大生存优势的博弈。这是笔者所见的众多定义中最为深刻者。以此观之,人类若无系统2即止步于动物世界,不可能在演化过程中脱颖而出;若无系统1则没有生命,当然也就谈不上系统2。系统1/2联手方有人类的今日。世界模型和大语言模型分别对应于系统1/2,并非本文开头提及的“路线之争”。二者唯有联手,方有AI的未来。更大的视野则是人之系统1/2与两种模型的关系。

笔者曾在5年前提出,就莫拉维克悖论而言,人工智能未来的发展可能有三种途径:其一,回过头来攻克悖论;其二,置悖论于不顾,沿认知-行为系统的演化途径绝尘而去;其三,前行与回头相结合。现在再看,可以说在一定意义上预言了世界模型的到来。世界模型正在“回过头来”攻克悖论;大语言模型不会“绝尘而去”;两种模型,前行与回头终将携手并进。在这一过程中,人类祖先的原始思维、野性思维和天人感应将发挥特殊作用。量子计算将赋予重任。

演化,从只有系统1的哺乳动物,经先1后2兼有系统1/2的人类,到先大语言模型再世界模型,先系统2后系统1相互分离且彼此竞争/合作,并终将走向融合的AI,走向人与AI共存的时代。没有AI,人类难以继续前行;没有人类,AI将失去存在的基础。

行文至此,还可以提出一个问题。在人脑与AI的关系上,以上所述均为外部联系,脑机接口或许能构建人脑与AI内在和直接联系的新途径。在世界1——实体:碳基小分子、神经元,硅基芯片;机理:电信号/量子效应——的基础上,连接世界2与世界3。需要追问的是,“机”所连接的究竟是人脑中的系统1还是系统2?

以下表作为本文的小结。

主要特征

个体/系统发育

主要特征

个体/系统发育

系统1

行动 快思维

通用 不同场景

本能 潜意识

莫拉维克悖论

碳基 脑干

漫长进化过程在先

功能优胜劣汰

沉淀为在后的结构基础

儿童/哺乳动物

知行系统

系统1/2属一个主体

系统2

认知 慢思维

联想//创造力

 

大脑皮层前额叶

碳基的天花板

后天 轴心时代

“思”故我在

“头”到“体”

始于幼儿的教育

生命/代际/教育周期 演化由

系统1-系统1/2共存/博弈-融合/死亡

情感 精气神

意向性 好奇心

隐性知识     

理性 延迟满足

编码知识

世界模型

物理空间 场景

因果关系

通用之难 生态

硅基等

跟随儿童/猫的足迹

揭开系统1快思维/

隐性知识之谜

消解莫拉维克悖论

感知 分析 决策 行动

全面介入产业/人类社会

大语言模型

另辟蹊径 助系统2一臂之力 通用

超越特殊场景

语境 上下文 泛主体 硅基 高耗能

 多模态

垂直模型-边缘计算致使系统2退化

人通过…获得解放

两个模型的

未来走向

目的论 意向性

奉承 无意向性

在某种意义上可以把此表格视为四个象限,系统1/2和两个模型各占一个象限,四个象限之间均存在从认知到现实的相互作用。脑机接口可能作用于四个象限全局

 

转载本文请联系原作者获取授权,同时请注明本文来自吕乃基科学网博客。

链接地址:https://wap.sciencenet.cn/blog-210844-1522894.html?mobile=1

收藏

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?