刘伟
大模型的窘迫:事实与价值 vs 数据与经验 精选
2025-4-25 08:37
阅读:1945

一个对象常常由它与其他对象的关系来定义。例如语言学中的词汇,一个词的意义很大程度上是通过它与其他词的关系来确定的。以“苹果”这个词为例,它与“水果”“红色”(一般情况下部分苹果的颜色)“可食用”等词汇产生了关联。在词汇系统这个结构中,“苹果”就是在与其他相关概念的对比和联系中被定义出来。

从关系本体论的角度来看,实体的存在和性质是由它与其他实体的关系所构成。比如,在生态系统中,狼的存在和其捕食者的角色是通过它与羊等猎物的关系来定义的。如果没有这种捕食关系,狼在整个生态系统中的角色和意义就会发生巨大改变。在图论中,一个节点(可以看作一个对象)的很多特性是由其与其他节点的连接关系来定义的。在一个社交网络图中,一个用户(节点)的影响力可以通过他与其他用户的关注关系、信息交流关系等来衡量。如果一个用户与很多其他用户有频繁的互动关系,那么他在这个社交网络中的影响力属性就可以被定义为较大。在数学范畴论中,对象是通过态射(可以理解为对象之间的关系,如函数等映射关系)来定义的。对象之间通过态射相互关联,一个对象的很多性质,如它是初始对象还是终端对象等,都是通过它与其他对象的态射关系来确定的。

在面向对象编程中,一个对象的很多行为和属性是由它与其他对象的交互来体现的。如一个汽车对象,它有启动、行驶等功能。这些功能的实现往往需要和发动机对象、方向盘对象等进行交互。汽车对象的“行驶”行为可以看作是通过和方向盘对象的转向关系、和发动机对象的动力输出关系等共同定义出来的。在数据库系统中,实体(可以看作对象)之间的关系是数据库设计的关键,在一个学校数据库中,学生实体和课程实体之间的选课关系定义了学生所学习的课程,同时也从另一个角度定义了课程被哪些学生选修。通过这种关系,两个实体的很多属性和状态得以确定。不过,也有一些观点认为对象不能完全由与其他对象的关系来定义。因为每个对象自身可能也有一些内在的、不依赖于关系的属性。例如,在自然语言中,一些基本的逻辑概念如“存在”“否定”等,它们的意义可能很难完全通过与其他概念的关系来定义。而且在物理世界中,一些粒子的基本性质如电荷、自旋等,虽然它们也参与到各种相互作用(关系)中,但这些基本性质本身是粒子固有的一种属性,不能完全被关系所涵盖。

关系本体论与事实本体论分别是如何定义事物的呢?关系本体论和事实本体论是两种不同的哲学观点,它们对事物的定义方式有明显的差异。

关系本体论强调事物间的相互关联,认为事物的本质和存在方式是由它与其他事物之间的关系所决定的。事物本身没有独立的、内在的本质,其性质和身份都是在与其他事物的关系网络中得以体现和确认。例如,在语言中,“上”和“下”这两个词,它们的意义是相互依存的,只有在两者的对比关系中才能被理解。事物的属性由关系决定,即事物的属性不是固定的、内在的,而是通过与其他事物的相互作用和关系来体现。比如商品的价值,在经济学中,商品的价值不是商品本身固有的,而是通过商品与其他商品之间的交换关系以及与货币的关系来衡量的。同样一种商品,其价值会因市场供求关系的变化而改变。事物的存在依赖于关系,一个事物只有在与其他事物发生联系时,它的存在才有意义。以生态系统中的物种为例,一个物种的存在依赖于它与其他物种之间的捕食关系、竞争关系、共生关系等。如果一种植物完全脱离了与其他生物和环境因素的关系,它也很难生存,其作为该生态系统中物种的存在状态就会发生变化。

事实本体论强调客观事实的基础地位,以客观存在的事实为出发点来定义事物,认为事物是由一系列独立于主观意识和相互关系之外的客观事实构成的。这些事实是确定的、独立的,并且可以通过观察、实验等方式被验证。例如,在科学研究中,原子的结构、物理定律等被看作是客观存在的事实,事物的性质和行为是由这些基本事实所决定的。事物具有内在的属性和本质,事物自身具有一些内在的、不依赖于与其他事物关系的属性和本质特征。例如,水的化学性质是由其分子结构(H₂O)所决定的,无论它与其他物质是否发生关系,这一本质属性都是固定的。再如,一个人的身高、体重等生理特征,这些是其自身所固有的属性,不会因为与其他人的比较或关系而改变。同时,需要以事实为基础构建知识体系,通过对客观事实的收集、整理和分析,来构建对事物的认识和理解。例如,在编写百科全书或科学文献时,通常会以事实为依据,对事物进行分类、描述和解释。如在动物学中,对动物的分类是基于它们的形态、生理结构、遗传特征等客观事实,而不是它们之间的相互关系。

相比之下,关系本体论认为事物的本质在于其与其他事物的关系;事实本体论则认为事物具有内在的、不依赖关系的本质。在关系本体论中,事物的属性由其与其他事物的关系决定;而事实本体论强调事物的属性是其内在的、固有的。关系本体论强调事物的存在依赖于与其他事物的关系;事实本体论则侧重于事物作为客观事实的独立存在。

大模型在发展过程中面临着事实与价值、数据与经验等方面的窘迫。主要体现在:(1)幻觉问题导致事实偏差:大模型基于概率生成文本,可能产生与事实不符的幻觉内容。如要求GPT4讲述“林黛玉倒拔垂杨柳”的故事,它会未经事实验证地拼接出荒谬情节。这种幻觉会削弱人机信任,在医疗、金融等关键领域易误导用户决策。(2)价值导向存在风险:大模型的训练数据来源于互联网,可能包含带有偏见或不当价值观的内容,从而在生成结果中传递出有问题的价值导向。例如某些境外大模型,带着意识形态的有色眼镜看待中国特色社会主义发展成就与制度优势,刻意混入虚假事实或错误评价,形成与主流话语不同的输出,误导公众认知。(3)缺乏常识与深刻理解:虽然大模型能处理大量信息,但缺乏人类的常识和对世界的深刻理解,难以准确判断信息的价值和意义。比如在一些需要结合具体情境和社会文化背景进行价值判断的问题上,容易给出不符合实际情况或主流价值观的回答。(4)数据质量问题:互联网数据存在错误标注、逻辑矛盾等问题,而大模型缺乏对数据真实性的鉴别能力,易抓取错误数据生成回答。且训练数据的时间滞后性,使其无法及时区分过时信息与当前事实,导致知识边界模糊。(5)数据处理与利用难题:一方面,大量数据以不同形式分散存放,如企业中的数据库数据、PDF文件等,未经整理难以直接用于模型训练,整理成本高。另一方面,通用大模型在应用于特定行业时,行业知识和语料不足,需进行二次预训练,但行业数据的获取、融合和脱敏存在困难,如医疗、金融等领域的专业数据受限于隐私和安全等因素,难以获取和使用。(6)经验积累与传承不足:大模型的发展时间相对较短,行业应用经验不足,在与传统行业的结合过程中,缺乏对行业特定业务流程、规则和经验的理解与传承,难以满足行业的复杂需求。相比之下,传统小模型在一些特定任务上已有较为成熟的应用经验,大模型需要时间去积累和学习如何更好地发挥作用。(6)行业数据样本不足:许多行业需要大量的高质量数据来训练和优化大模型,但实际中这些数据往往难以获取。例如在一些专业领域的研究数据、实验数据等,数量有限且获取成本高,限制了大模型在这些行业的深入应用和性能提升。

《逻辑哲学论》一书中“世界是由事实构成的,而不是由事物构成的”说明关系是描述世界的关键,而不是一个个比特与token……

人机环境系统智能.jpg

未来的智能.jpg

人大出版社6.jpg

转载本文请联系原作者获取授权,同时请注明本文来自刘伟科学网博客。

链接地址:https://wap.sciencenet.cn/blog-40841-1483331.html?mobile=1

收藏

分享到:

当前推荐数:4
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?