赛义甫的个人博客分享 http://blog.sciencenet.cn/u/saif 逻辑学、数学、计算科学、语言学和哲学——关于形式科学的思考

博文

三聊语义学——语义学到底是什么(一)? 精选

已有 22301 次阅读 2016-12-21 14:49 |个人分类:语义论|系统分类:科普集锦

前两次聊语义学,我们没有什么章法,想到那里就说到哪里,只是想通过这种形式引起读者对语义学的好奇心,不管是喜欢也好、讨厌也罢,至少让你知道了语义学大概是干什么的、以及这门学科和其它学科间的关系。如果你来到这里,至少说明你对语义学的关心超出了只看第一篇的读者,可能真的对语义学开始感兴趣了。本篇小文想把前面两篇内容稍加整理,并加上理论的说明,因为在前两篇中,我们并没有十分严格区分词义、句义,有时候聊词义,有时候聊词组、有时候聊句子。同时,对语义的介绍有时是从语言的角度,有时又跳到哲学、语言学和数学,有时候我们讨论语言事实,有时候又谈到历史。这样做只是想给读者一幅画面,五彩缤纷、多姿多彩,至于这个画面的基本内涵我们则尽量避免讨论。而在本篇讨论中,我们会重新讨论前面聊过的问题,力求使所讨论的问题更有条理。

从上两篇聊天,我们知道了这样一个事实:所谓语义学其实是两门学问,一门是逻辑学的,一门是自然语言的。而且我们也提到,自然语言的语义学,早先是用meaning,研究词义、词组义、句子义、篇章义,只有逻辑学才使用semantics,研究命题的真值。但是后来特别是上世纪50年代后,semantics的使用范围逐渐扩大,除了逻辑学、语言学,连计算机科学也开始使用这个词来表示程序设计语言中基本指令单位与机器逻辑结构之间的对应关系。其实,不难想象,只要是用符号系统表示另外的世界,都需要meaning、semantics的研究。这里所谓的“世界”可以理解为一种学科、例如数学、哲学、物理学等,也可以理解为“语境”,一种上下文关系。更抽象一点,可以把“世界”理解为一个系统,这个系统由基本元素、、连接、组合元素的规则、法则(law)和原则(principle)以及元素之间的各种关系。更具体一点,我们从现实生活某个情景、过程、经历等也是这里所定义的“世界”的例子。例如,我们政治生活中的官场就可以看做一个“系统”;官员进了官场,就要对这个系统构成、机制彻底了解,要知道谁是你的上级、下级、同事,他们的习性、特点和行事风格,因为这是构成官场的基本元素。而做官的基本行为,要受制于作为这个系统内所建立的基本法则,以及大大小小的原则、规则、潜规则,官场动力学、支撑这个系统运作的基本规律等等,这样官员才能建立一个官场内通用的话语语义系统,使领导、同事、下级知道你在说什么以及你的真实意图,从而保证这个官员在这个系统中正常存在。

再拿数学来说,自然数,我们可以用“一、二、三、…”表示,也可以用“1, 2, 3,…”,各国语言都有表示数字的特定词汇。但是这些符号的不同并不影响我们理解自然数的本质,为什么?因为所有各种不同的符号都只对应于一个世界:自然数集。而对这个自然数集世界的物理描述就是数轴,一条带有原点、单位的向左右两个方向延伸的直线;数学家们把这条直线看做是对数的世界的模拟,称作模型。我们使用的文字“1, 2, 3,…”、或“一、二、三、…”、或“one, two, three,…”都与这条直线的某一点有一对一的对应关系。有了这个对应关系,就和“官场”一样了,我们可以确定任意自然数,根据序列原则,就会知道这个数的前一个、后一个,建立数与数之间的互动法则:基本代数运算,以及这些法则施行时的规则、潜规则。数学也有“潜规则”吗?小学生做减法时都知道不能拿小一点的数减去大一点的数,因为那样没有好果子吃。还有一些半“潜规则”:除数不能等于0,至于为什么,老师一般不会讲得很清楚,我们也不会追究,只知道不可以。


从以上这些例子,我们可以归纳语义学最本质的东西,它们是由四要素构成的:
一、符号系统:不管是数学中的数、还是自然语言中的话语,以及计算机语言中的基本表达式,只要是成系统的符号都可组成符号系统;例如中学代数中的 (a,b,c, x,y,z, +,-,×,÷)就是一个符号系统;
二、世界:所研究的对象、现象,如物理学中的物质和运动、生物学中的细胞、基因等;
三、模型:对“世界”的建模;建模可以通过数学工具、几何手段,或其它可以说明该“世界”本质特征的手段。可以说,“世界”是现象,模型是对世界某个局部的放大、细化和抽象,专业一点的说法叫做“领域”(domain),或者叫“论域”(universe of discourse)
四、对应关系:建立模型和符号系统之间的对应关系,这个关系就是符号系统的语义。街上买了块糖,糖纸就是符号,裹在里面的糖块就是论域中的元素。

有了上面的介绍,相信读者对语义学已经有了大致的印象。在本篇中,为了使我们的讨论更具体,我们将把以前涉及到的内容分类,条理化,具体地说,我们将把迄今为止谈到过的内容分为两类:一种叫做语义论(semantic theory),另一种叫做关于意义的理论(theory of meaning),或简称为“意义论”。这样,我们就有了三个术语:
语义论(semantic theory):就是我们在上面刚刚归纳的4要素:符号、世界、模型和对应关系;这种理论基本上就是我们一直作为重点的基于逻辑学的语义学;
意义论(theory of meaning):语义论在运用过程中的心理学、社会学作用,也就是说,在上面4要素的基础上,重点研究语义论体系之外的心理学和社会学因素,例如第一篇聊天谈到的意义的解读以及更复杂的互动关系。关于这一点,我们前面的聊天只是蜻蜓点水地泛泛而谈,没有涉及到理论性的东西。
语义学(semantics):二者的统称。

从字面上,本人更想把semantic theory称作“义论”,而theory of meaning称作“意论”,不过我们的动机是要排岐而不是增岐,故仍然用“意义论”表示theory of meaning,而用“语义论”表示semantic  theory,而用“语义学”(semantics)作为二者的统称。这两种区分,其实是要回答两个有关联但又不同的问题:
语义论要回答的问题是:这个符号、或者这组符号要表达的意义是什么?
意义论要回答的问题是:对使用该符号系统的人群来说,根据什么这些符号具有这样、那样的意义?(想想我们上篇“馒头花卷和自行车轮胎”的例子)
因此我们的介绍也就分成两部分,第一部分是语义论(semantic theory),第二部分是意义论(theory of meaning)。
我们的讨论框架将放在现代哲学的语境中而不涉及逻辑学、数学的技术细节。如果你对逻辑学的语义学方法、技术细节感兴趣,可以关注我的博客文章《卡尔纳普<符号逻辑及其应用导论>读书笔记书评》。

第一部分    语义论(semantic theory)
到现在为止从我们的讨论可知,语义论的核心理论就是对应理论——符号系统中符号和其它系统中实体的对应关系。例如数学中一个二次函数的每一对x,y值,都对应一个二维平面上一条曲线上的一个点,我们在日常语言中提到的人名、地名等也都对应着现世界中的一个具体对象。所谓意义,就是符号所指称的客体:(3,4)的意思就是在平面直角坐标系第一象限上的一个点,而y=2x的语义则是对应这个坐标系上的一条直线,“天安门”所表示的就是北京市中心长安街上的一座建筑物。
那么如何表达对应理论呢?一种就是我们一直在谈的基于逻辑的方法,利用一阶逻辑研究semantics的方法研究自然语言。当然,我们也提到过,这种方法太弱,无法处理自然语言中多种多样的语言形态。我们还提到,美国学者Montague从一阶逻辑开始研究自然语言的语义,然后逐步升级逻辑的版本,一阶逻辑不够就加上二阶逻辑,模态逻辑和类型理论等基于逻辑方法的语义论,今天我们就详细谈谈这个问题。

首先,我们看一下对应理论的最简单形态:指称论(the theory of reference)
所谓指称论是指:存在一套符号体系,这个体系的每一个成员都唯一对应着一个实体。最典型的例子就是身份证号码和每个中国公民的对应关系。我们每个人都有一个身份证号码,而每一个身份证号码也仅代表唯一一个个体(有些人违法占有多个身份证号码的非法状况这里忽略)。这个时候,一组号码的“语义”就是指某个个体。号码系统和中国人口就可以建立一个一对一的映射关系。
对这个事实的语言表述就是:xxx的身份证号码是99999999999;例如:张三的身份证号码是19881203456789,如果张三的号码确实是19881203456789,那么这个句子的意义就是对现实的真实描述。如果把这个句子的主语换成“孔子”,那么我们就知道这个句子并不是对现实的真实描述,而导致句子没能描述真实是因为主语的替换,从“张三”换成了“孔子”。如果把主语再换成“山西省曲沃县”,那么这个句子就更加错了,因为身份证号码的主体只能是人。再把主语换成“奥巴马”,句子也不对,因为奥巴马不是中国人,不可能有中国的身份证号码。虽然上面的句子除了第一个全错了,但错的方式不尽相同。要纠正错误就必须对句子的主语加以限制:首先,主语必须是人,不能是地名或其他;第二,如果是人必须是现代活着的人,不能是古人;第三必须是中国公民而不能是外国人。这样,我们就可以对身份证持有者的“语义”明确定义:人类、现代人、中国人,如果用集合概念,就知道现代人和中国人是人类的子集,而身份证号码持有者就必须是现代人与中国人的交集。只有这个集合才是身份证号码对对应的论域,说成大白话就是:只有这个集合中的成员才能持有身份证。而要使上面的句子的命题为真,只有论域中“张三”这个标识符所对应的个体才符合条件。不过论域中对象和句子中表达式的类型问题并不是我们现在这个指称论可以解决的,这个问题要在类型论中解决。如何从句子知道“张三”这个个体与19881203456789是一对一对应呢?很简单,把句子成分颠倒一下就知道了:19881203456789是张三的身份证号码。这在数学上叫做叫做交换律,一个符号系统中的成分顺序颠倒其“值”不变,所以我们可以看出,语义其实是“值”更广义的说法。在我们这个例子中,我们知道这两个句子都成立,也就说这两个句子的语义相同,用数学的语言,叫值相等。更一般地说,如果把“是”看做是一种关系,那么“是”关系中的两个元素符合交换律,则其语义相同,亦即,其命题真值不变。由此以看出,指称论的实质是两个世界,符号世界和论域所模型化的其它系统(世界)之间严格的一对一对应。这种对应是理论上最理想的状况,因为它排除了任何可能的歧义,它的数学表述就是所谓“双射”(bijection)关系。

在现实生活中指称论的用途是很大的,除了身份证的例子,其实对任何数据的信息化管理,都需要一个唯一识别标识作为身份指认,而具体手段未必一定是号码,例如现在流行的指纹识别也是指称论的应用。
指称论的另一种形式是:某一个体具有某个属性;例如,“张晓华很聪明”。其中“张晓华”这个符号代表某个人类个体,“很聪明”则代表某个“属性”,而“属性”这个概念是我们对现实世界建模时所创造出来描写一些个体所具有的共同特征,“属性”的数学意义就是论域的某个子集。上面这句话的语义就是:张晓华这个符号所指称的个体具有“很聪明”这个群体特征的所共有的属性,它对应着现实世界的一个具体场景。有人可能对这个解释不满意:你并没有说“很聪明”是什么意思,而只是说“很聪明”是一种属性。但是,如何解释“很聪明”呢?如果我再用其它词汇去解释那么我们可以进一步问那个词是什么意思?这样的结果只能造成无限的循环定义,或者我们再无“言”以对,因为所有“定义”词汇都用光了。指称论就是要避免这样的尴尬,它不是给你解释词义,句义,而是模仿现实世界建一个模型,以这个模型为现实世界的缩小版,然后说,某个符号组合对应着模型中的某一情景。对应,而不是说明,是指称论的实质。个体和属性在语义上不满足交换律关系,“张晓华很聪明”不等于“很聪明的是张晓华”,为什么?我们的常识告诉我们,世界上聪明人多着呢,不是就张晓华一个。而我们的语义理论和这个常识差不多,“很聪明”是一个属性,而属性的数学解释是论域的一个子集,“张晓华”只是这个子集一个成员而已。对这个思想的表述就是:很聪明(张晓华),读作:在“很聪明”这个群体中“张晓华”是其中一个成员。这是指称论的第二种情况:论域中某一个体元素是该论域某个子集的成员。

从理论上讲,指称论实际上就是一阶谓词的语义理论,也是数理逻辑中模型论的起点。个体、属性、命题是谓词逻辑对描述对象的建模,相应的逻辑句法则是:常项、谓词和句子,其中,常项代表“领域”中的个体,谓词代表属性,而句子代表命题。

除此之外,指称论中个体的数量对于句子的语义也会有影响,因此谓词逻辑的一个重点之一就是量化问题,所对应的符号就被称作“量词”。这里虽然不对量词做更多分析,但给出个例子,说明个体数量对句子语义的影响:
(1)
他没买门票就混进去了
我也没买门票
————————————
(所以)我也能混进去。
这是一个逻辑推理,我们把推理正确称之为“有效”,否则称之为“无效”。按照我们的生活常识,“我也能混进去”偶然性太低了,换句话说这个推理的有效性太低了(当然不否认现实中有许多人做这样的推理,期望“万一”)。
(2)
一半的人没买门票就混进去了
我也没买门票
——————————————
(所以)我也能混进去。
毫无疑问,在(2)的情境中,“我也能混进去”的可能性大大高于(1)。而造成这种情况的原因就在于作为前提命题的主语从单个个体变成了复数群体,这使得结论命题的真实性大大提高。
(3)
所有的人没买门票就混进去了
我也没买门票
————————————
(所以)我也能混进去。
这个时候,“我也能混进去”的真实性就不容置疑了。
从这个例子可以看出,量词对于句子的语义有时起着决定性的作用。

总结:作为谓词逻辑语义论核心的指称论对理想的、有着一对一对应关系的世界是非常有效的,这种世界,一般都是人造的形而上世界,最典型的就是数学。这也就是为什么数学的形式化,数学符号的语义可以用一阶谓词逻辑描述。而数学本身又可以成为其他科学对现实世界建模的工具,也是因为数学的严格性和对实体对象描述的精确性。
今天,先聊到这里,下次我们谈谈指称论的局限性,用它来研究自然语言的语义有什么问题。



https://wap.sciencenet.cn/blog-2349385-1022232.html

上一篇:卡尔纳普《符号逻辑及其应用导论》读书笔记书评(2)
下一篇:三聊语义学——语义学到底是什么(二)?
收藏 IP: 70.77.196.*| 热度|

4 强涛 黄永义 康建 黄荣彬

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-10 06:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部