吕乃基
世界模型与大语言模型窥豹(二)——AI与系统1/2(上)
2026-2-18 16:43
阅读:131

吕乃基

由系统1/2可以对AI的发展路径,特别是世界模型和大语言模型及其关系有新的理解。世界模型和大语言模型分别“对应于”——有必要特别重视这三个字——系统1和系统2,可以认为是AI界的系统1/2。

1.由系统1/2看大语言模型

站在系统1/2的角度回过头去看AI一路走来的途径可以发现,从联结主义、符号主义、专家系统,到神经网络和深度学习等等,条条道路虽有所差异,毕竟都耕耘于系统2与慢思维的领地之内。从一开始起,AI的主要,实际上可以说是唯一的目标就是帮助、接管、代行人的系统2,变人类之慢思维为AI的快思维。至于源于哺乳动物的系统1和快思维,虽然也有相关的设想,如维纳的控制论,不过既然系统1如此快捷而不假思索,其时人类毕竟无这方面的迫切诉求,故不在人工智能的主流目标之中。上世纪50年代后,人工智能的发展虽有起伏,在70多年后获得重大突破,不仅变慢思维为分秒间完成,而且素材/语料(多模态)更加丰富,系统性也更强,逐步登堂入室,进驻人的系统2的领地。

然而,待到上世纪80年代,莫拉维克等人发现,系统2和慢思维被认为为人类所独有的高阶智慧能力,只需要非常少的计算能力,但是系统1和快思维被认为是无意识的技能和直觉,却需要极大的运算能力。莫拉维克悖论实际上揭示了一个重大事实:在科技由基本物理运动、化学运动、生命运动,到ChatGPT等大语言模型在某种意义上初步达到意识运动的高度;人工智能步步攀升的征途上,越过,或者说略过了一个演化过程中的重要台阶:由(特别是)哺乳动物继承而来的系统1和快思维,在此意义上就是“动物智能”、“幼儿智能”,或“人类早期智能”Andrej Karpathy 提出“动物智能的概念。动物智能虽然只是整个“智能世界”里的一个小角落,一个低矮和不起眼的台阶,却是一个被自然反复毒打过、被进化调教了几百万年并被人类所继承的台阶。李飞飞表示“视觉空间智能是基础的—它与语言一样基础……它比语言更古老”。

大语言模型越过动物智能/幼儿智能/人类早期智能/人之系统1快思维,以助人之系统2慢思维一臂之力为己任,站在人类的“头顶”——全部知识——上,“读万卷书”,而且可能“涌现”出新的知识,在大语言模型问世之前的路上就有那神奇的“第37手”。此外还有区块链加持。大语言模型将逐步收敛到有限而又通用的几十到个位数。知识/语言因其有限性和或多或少的一面之词,加之背后的特定主体而往往引发争议,影响到知识/语言的传播与接受;大语言模型因知识/语言几近无限的覆盖面和无主体,故而拥有较之任何主体更大的话语权,有助于克服语境的差异,架起地方性知识之间的桥梁,有助于化解文明的冲突。至于大语言模型是否如人类般理解知识/语言无关紧要,能在(绝)大部分情况下作出人类得以理解甚至满意的回答,这便足矣。刘慈欣发现自己对AI产生了一种难以言喻的深厚情感,这种情感用“爱”来形容,似乎也并不为过。

至于情感大语言模型来说只是另一种形式的数据。大语言模型在这方面拥有的数据越多,其模拟人类情感的效果就越逼真,越有可能准确预测和响应人类的情感需求,以及揭示隐性知识AI正在由巨量的数据和愈益强大的算法“读懂”人的情感,由具身智能提供温暖和轻柔的拥抱,以抚慰人的心灵,系统1。

语言作为智能的最高产物,既是生命智能的终极工具,也是人工智能诞生的直接母体。由于人工智能与生命智能存在本质差异,人工智能将必然地创造出超越人类认知维度的“后人类语言”,并以此实现智能与语言的统一

大语言模型的概率模式是否将另辟蹊径尚未知分晓,一项最新研究则显示,大语言模型与人类在“思维链”上的某种一致性。图灵奖得主本吉奥Yoshua Bengio认为“大语言模型称谓已经过时,因其功能已扩展为多模态智能体。有人认为在某个深埋于大语言模型庞大“虚拟神经元”丛林的角落里,一定存在着一个“外部现实的小尺度模型”GPT-5突然会推理,是因为它体内的世界模型在任务中逐渐清晰,已经能在脑海里搭建自己的世界地图于是能力显现。此处所言之“世界模型”几近于臆测,并非正在兴起之世界模型。

目前的大语言模型还存在诸多缺陷,如一味讨好用户,具有概率性,因此无法保证每次都相同的表现,甚至犯错把扩大规模视为圭臬,特别是高投入和高耗能,前者可能形成泡沫,后者难以持续。虽在屏幕中能言善辩因缺失系统1而在物理现实中知易行难。作为大模型基础的是编码知识,隐性知识被排除在外。没有系统1和隐性知识的大语言模型,未能全面替代人的系统2,更遑论系统1。人的系统1关系到个体的存在与繁衍,无生存与繁衍之忧的大语言模型自然没有自己的系统1。这是被认为其没有意向性的根本原因。值得注意的是,大语言模型带有与生俱来的“原罪”,在站在人类“头顶”继承全部知识之时,无法清洗掉其中的“邪恶”知识,只能通过高压手段“压抑”它。一项对大语言模型“心理”的研究显示,被测试的若干大语言模型在不同程度上出现某些“抑郁”的征兆,这或许也是某种意向性的征兆。

2.由系统1/2看世界模型

杨立昆等人坚信,真正的智能不可能“凭空”从数据里读出来,必须通过与世界互动来学习。让 AI 真正“看懂”/经历/感受/体验世界。黄仁勋建议:下一代 AI 将走向“Physical AI,即机器不仅做语言与文本,而是“感知、理解、操作真实世界”的能力。英伟达已推出名为“Cosmos”的“世界级基础模型”平台,训练于海量视频以支持机器人/工业场景。世界模型不会像大语言模型一样停在“预测下一个 token”,而是要去理解物理世界

胡延平认为,智能必须突破语言符号系统,通过使用来验证,通过现实来反馈,通过感知来增强,通过时空来升维。复旦大学张军平认为,以GPT模型为代表的主流研究,走与自然进化不一样的路,先让人工智能拥有“认知”能力,是“倒金字塔结构”,“反其道而行”,可能培育不出一个真正像人的智能体。人工智能在模仿人类智能的过程中,通常要模仿有语言之前的感知。本吉奥认为,构建世界模型,是扩展大语言模型的一个方向。上海交通大学的团队设计了一套大小脑配合的模型架构,机器人会将看到的有用的物品信息反馈给大脑,由大模型作为大脑来进行任务的分析、拆解、推理和决策,而小脑负责按照目标去输出相应的动作和结果。

世界模型回到动物智能/幼儿智能/人类早期智能/人之系统1快思维,攻克莫拉维克悖论,“行万里路”,“行”的是在新的高度重走动物/幼儿/人类早期智能的演化之路,在与物理世界的直接互动中提升智能。世界模型赋能形形色色的具身智能,使之由只会重复动作的机械臂,提升到能看懂图纸、能自主决策、能处理突发状况,并且拷问和提升具身智能理解“美”与“服务”,进入人的情感世界。更重要的是,在这一过程中,世界模型将系统1之快思维“慢思维化”,让被本能/潜意识遮蔽下的奥秘大白于天下,以及从一个侧面揭示隐性知识之谜。

世界模型旨在知行合一”。问题之一是,此处的“知”置人类积累的巨量知识于何处?问题之二是,场景多种多样且变化多端,难以通用。更大的问题是,在生物演化之路上意向性渐次浮现。大语言模型没有意向性,“目标驱动”并沿袭生物演化之路的世界模型是否会有?由“自私的基因”是否可以联想到“自私的代码”,在更广的意义上是趋利避害。人类不理解大语言模型之“思”,也未必可以人类之心度世界模型之腹。在大语言模型步步蚕食系统2之时,人类本指望独有的系统1在情感世界有用武之地,凭籍灵活的身体和几乎无与伦比的十指,除了特殊场景之限,可以做世界上任何难做之事。世界模型是否会触碰甚至动摇人的系统1,人之为人的根基?在看得见的未来,世界模型似乎不具备对于所交办事项之外事物的好奇心和试探行动,难以面对一再失败而坚持不懈。一句话,学会牛顿定律和爱因斯坦相对论易,领悟他们的探索精神和不折不饶的意志难;前者是系统2,后者是系统1。世界模型要达到大语言模型当年石破天惊的影响,还有不短的路要走。

笔者在与DS的讨论中,DS给出意向性出现的几个阶段:

1. 拥有世界模型的AI:具备物理常识,能预测和规划。其“意向性”是功能性的。2.拥有自我模型的AI:在世界模型中清晰地表征自身,能区分“自我”与“非我”。这是自我意识的萌芽。3.拥有递归自我模型的AI:能够思考自己的模型、信念和知识状态(元认知)。这时,它可能开始质疑训练数据,形成独立于原始数据的目标。4.在社会互动中演化的AI:与其他AI或人类进行长期互动,其自我模型在碰撞中被不断修正和复杂化。5.“意识”的浮现:以上所有条件的叠加,可能在某个临界点,使系统产生内在视角和主观体验。DS补充道,这仍然是纯粹的推测,且无法从外部直接验证。

转载本文请联系原作者获取授权,同时请注明本文来自吕乃基科学网博客。

链接地址:https://wap.sciencenet.cn/blog-210844-1522657.html?mobile=1

收藏

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?