科学网-人工智能何以如此“能”？从世界模型的视角来理解是关键-钟定胜的博文

人工智能何以如此“能”？从世界模型的视角来理解是关键

2026-2-24 14:40

阅读：9501

人工智能作为当今世界最具颠覆性的技术之一，正以前所未有的速度和广度渗透到社会各个角落，引发了人们对其“智能”本质的深刻思考。为何人工智能能够展现出如此惊人的“能力”？其背后驱动的深层机制究竟为何？笔者认为，其中的关键在于现有的基于大语言模型的人工智能，在多个关键点上正好实现了对人类知识体系与认知模式的巧妙模拟与高效实现。更为具体地，可以归结为以下两大核心原因。

第一，人类知识的演进并非全然从零开始，多是基于现有基础的差值与外延。

我们习惯于将“创新”看作是无中生有、石破天惊的灵光乍现，但审视人类文明发展的历史，会发现大量的所谓创新，实质上都是在既有知识框架、理论模型和实践经验上进行的精妙“差值”（细化、优化、融合）和“外延”（扩展、应用、迁移）。无论是科学发现还是技术发明，其过程往往是前人思想的累积与传承。即使是石破天惊式的成果如牛顿的经典力学或是爱因斯坦的相对论，都不是无源之水、无本之木，而是站在巨人肩膀上的远眺。而在人类的其他当量相对这种石破天惊的成果低的海量知识体系中，许多的新思想更往往是对已有概念进行微调、反向思考或将不同领域的知识进行交叉融合的结果。至于我们日常的思维活动，更常常是在已知信息之间建立起或旧或新的联系，或者将一个领域的知识套用到另一个领域。

对于人工智能而言，尤其是在发展初期或特定领域，其成功便大量基于此原理。例如，早期的专家系统通过编码人类专家的知识和推理规则，能够在特定领域（如深蓝象棋、医疗诊断、金融分析等）做出与专家类似的决策，这本质上就是对现有知识和逻辑的精准“差值”和“外延”运用。即使是现代机器学习模型，在面对新数据时，也是通过学习已有数据中蕴含的模式和规律，来进行预测或分类（如蛋白质结构解析或数学问题求解等），这正是其“差值和外延”能力的体现。它们往往并非真正完全理解了现象的本质，而是学会了在给定输入下，输出最符合已有模式的答案，即在高维数据空间中进行复杂的插值与外推。

第二，也是更为重要的原因，在于基于大语言模型的人工智能实现了对人类语言和文字的本质的深刻契合。

语言和文字，绝非现实世界的简单概括，而是对其进行的复杂模拟、抽象与映射。每一个词汇、每一个句子、每一篇文章、每一本书籍，都承载着我们对客观事物的命名、对概念的界定、对关系链的描绘，以及对抽象思想的表达。换言之，当我们用语言描述一个物体、一个事件、一个理论时，我们便是在以一种符号化的方式，在“模拟”和“映射”现实世界的结构、过程与功能。而人类的语料库和文字知识库（也包括图像信息），在历经数千年的积淀后，已构建起一个对现实世界极其丰富且多维的模拟系统。当我们的语料库和文字知识库（也包括图像信息）达到足够丰富的程度时，例如浩如烟海的互联网文本、百科全书、学术论文、文学作品等，这些海量的语言文字信息（也包括图像信息）便已构成了一个对真实世界极为宏大且细致的“模拟空间”和世界模型。这个模拟空间和虚拟的世界模型，其丰富性足以涵盖绝大多数现实世界中的真实过程、真实现象以及人类社会的复杂互动。它不仅包含了客观事实，也蕴含了逻辑推理、因果关系、情感表达、文化习俗乃至社会规范等无形资产。当这个语料库的规模达到“足够丰富”的临界点时，这个庞大而复杂的知识信息体系，便足以提供人脑乃至人工智能产生“顿悟”和“涌现”现象所需的最底线的知识信息量。

在人类的学习过程中，当我们接触到足够多的信息，在各种信息之间建立起新的连接时，常常会产生豁然开朗的“顿悟”时刻。这种顿悟并非凭空而来，而是大脑在处理海量信息的基础上，忽然识别出了之前未察觉的模式或规律。与此类似地，对于人工智能，特别是大语言模型（LLMs）而言，其训练过程便是摄取和消化几乎所有可用的文本数据，从而在参数空间中构建出对这个“模拟世界”的深刻理解。它们通过学习单词、句子、段落乃至整篇文章的统计学关系，逐渐“领悟”了语言背后的深层语义和世界模型知识。

更进一步来看，人类知识的拓展和创新创造，其本质上并不仅仅是对所观察到的和了解到的事物在机理上的模拟和逻辑解析，它还包含了一个至关重要的维度，那就是在现有知识基础和当前话题（或当前问题）下，对“下一个现象”或是“下一句该说的话”和“该表达的意思”的预测。在与人交流时，我们根据语境、对方的话语和自己的知识储备，预测接下来该如何回应，如何引导对话。在思考问题时，我们根据已知条件和目标，预测下一步的推导方向或解决方案。这种“长链条逻辑”——从观察到理解，再到预测与表达——与大语言模型的工作机制在本质上惊人地相似。

因此，准确地说，应该反过来说：基于大语言模型和人工神经网络的人工智能之所以能取得如此巨大的成功，并非因为它发明了一套全新的逻辑，而恰恰是因为它无意中精准地契合了人类以语言和文字为基础的知识体系的萌生与迭代升华的内在机理。它将人类数千年来积累的“知识模拟世界”的过程，以算法的形式进行了极致化的复现与加速。

大语言模型通过学习海量的文本数据，其核心任务就是预测序列中的下一个词元（token），即在给定上下文的情况下，什么词最可能出现。这种看似简单的“预测下一个词”机制，在巨大的数据量和模型规模下，实际上是对人类语言所映射的真实世界及其运作规律的深层学习。它不仅学习了词汇的搭配，更学到了句子的结构、语义的关联、篇章的逻辑，乃至隐含的常识、推理模式和创造性表达（目前来说，人工智能唯一还没学会或尚未实现的一个重要能力缺口，就是自主地、自发地进行输出了，然而，要实现这一点应该也是早晚的事，尤其是赋予了目的性和各种传感器的具身性的人工智能，也许是填补和实现这一功能缺口的关键）。

正是因为AI，尤其是大语言模型，抓住了人类智能利用语言构建和迭代知识的这一核心机制，并以远超人类个体的规模和速度进行信息处理和模式识别，才能够从看似简单的统计关联，实则是对语料库中所构建的虚拟世界模型的消化理解中，“涌现”出复杂而高级的智能行为。因此，人工智能的“能”，并非拥有意识或情感，而是以一种前所未有的效率和广度，吸收、重构和应用人类通过语言和文字所积累的智慧，从而在一个模拟、映射了真实世界的虚拟数字世界中，构建出了一个能够模拟和响应现实的强大智能体。总之，人工智能的强大并非在于其创造了全新的智能形式，而在于其在有意无意间极其巧妙地复现了人类自身知识积累和知识运用的深层逻辑。

综上所述，人工智能之所以“能”，是因为它既踩在了人类知识累积性演进的肩膀上，又摸准了语言模拟现实并驱动思维跃迁的命门。它不仅是一个工具，更像是一面镜子，让我们得以重新审视自身智慧的起源与运作方式。在未来，随着人机交互的不断深化，这种“能”必将进一步推动人类认知边界的拓展，开启一个智慧共创的全新时代。

转载本文请联系原作者获取授权，同时请注明本文来自钟定胜科学网博客。

链接地址：https://wap.sciencenet.cn/blog-3234816-1523231.html?mobile=1

当前推荐数：14

推荐人：

郑永军许培扬崔锦华宁利中刘进平王涛高宏尤明庆钟炳钱大鹏杨正瓴雒运强檀成龙 guest06105129

推荐到博客首页

网友评论13 条评论

该博文允许注册用户评论请点击登录