李维
【科普小品:文法里的父子原则】 精选
2013-8-6 23:10
阅读:10235
标签:父子, 语言学, 依存关系, 文法

语言学听上去既文傻,也枯燥,学完了还找不到工作,可真学进去好玩的事儿多着呢。今天就讲一桩,叫老子和儿子的语言学。本来是讲给实习生听的,他/她们琢磨 PP-attachment 正困惑呢。故事讲完了,乘兴就写出来吧。徒吾徒,以及人之徒,许是功德一枚。

       

乔神仙(Noam Chomsky)                        特神仙(Lucien Tesnière)

话说这语言学里面有一门学问叫文法。学文法简单来说就是学画树。各种各样形态各异的树,表达了语言的多姿多彩,却万变不离其宗。奇妙啊。当年上帝怕人类同语同心去造通天之塔,乱了天地纲常,遂下旨搅乱了人类语言。印欧汉藏,枝枝蔓蔓,从此语言的奥秘就深藏不露。于是催生了一批文法学家,试图见人所不能见,用树形图来解剖语言的结构。忘了第一个画树的人是谁,感觉上这不是人力可为。天机不可泄漏,泄漏者非神即仙。历史上有两位功力非凡的文法神仙专门与上帝作对,各自为语言画树,一位叫 Tesnière,另一位就是大名鼎鼎的乔姆斯基


本来我们说话写文章都是一个词一个词往外蹦,这样出来的句子数学上叫线性一维。可这线性的东西到了文法家眼里就变了,一维变两维,线性变平面,于是产生了树形结构。上图的树就是我们训练出来的文法机器人( parser) 自动生成的,虽然并非完美无缺,倒也风姿绰约。最可爱的是,这机器文法学家玩这一维变两维的游戏是乐此不疲,只要你源源不断送文章给它,它就没完没了地给你画树玩儿。这要是人可就要小心了,这玩意儿不能入迷,入迷了看什么都是树,最后在森林里面湮没,也不是不可能的。

有两大类树,都要倒过来画的,根朝上叶朝下,依据的是两种语言学理论,代表人物就是前面提到的神仙特氏和乔氏。上面的树就是特氏的依从关系树(dependency tree),它直接把作为文法基本单位的词与词串成树形。还有一种就是乔氏短语结构树(phrase structure tree),特点是在基本单位之间加了很多中介(non-terminal nodes),然后成形,这种树此处不议,略过。这里画的都是依存关系为主的树,只是有些树的节点上保留了一些短语结构的痕迹(譬如 NP,PP 等),有时候叫作混合树(hybrid tree)。

依从关系文法里面有一条著名的君君臣臣父父子子的原则,说的倒也是大白话:一个孩子最多只有一个老子,老子则可以有 0-n 个孩子

其实,孩子当然可以有多个老子,譬如乔布斯就有两个老子,一个生父,一个养父。但是从法统上,只能有一个。这个法统在文法上就有了体现。比较下面这两个英文句子:

We asked him to leave immediately

We asked that he leave immediately

这两句的用词以及意思都差不多(有细微差别),但句法却不同。从深层的逻辑意义上说,he/him 既是 asked 的宾语,也是 leave 的主语。可是文法不答应,它要遵循一个孩子最多一个老子的原则。为此,第一个句子使用的句型采用了两个文法手段,一是用宾格来强调 him 是宾语,不是主语;二是用不定式(带to的动词)来切断主语谓语的可能瓜葛(英语不定式不能做谓语)。同理,第二个句子用了另外一种句型,采用了另外两个手段:一是增加了从句小词 that 来切断 he 作为 asked 宾语的可能性;二是用主格 he 来表达它的谓语老子是 leave(虚拟式谓语,不用 s)。图示如下(S表示主语,O是宾语,Com是补足语,Adv是状语,Mod是定语,Cl是从句):

这是执行这项父子原则时手段黑白分明的情形。但是自从语言被上帝弄乱了以后,手段有时候不够使唤,譬如主格宾格的手段只在代词(而且 it/you 还除外)身上显现,到了名词(譬如 John)身上就指靠不上了:We asked John to leave immediately vs We asked that John leave immediately,好在还有小词 to 和 that 在那里罩着,隐约还可看到主谓(that John leave)区分于动宾(asked John to...)的形式痕迹。可是到了汉语这些小词全没了,上面两句翻译过来就一样了,主语宾语还怎么区分呢?

我们请他立即离开。

汉语学家于是创造了一个特别的术语叫“兼语”(兼做主语和宾语),正式认可了这种违反原则的语言事实:


可见凡是叫做“原则”的东东就是一条超大的规则,上有规则下有例外是语言常态,因此违反原则的事并不鲜见。汉语出兼语,就不讲原则嘛!头脑里怎么想,就直通通出来,也不穿一套文法西装(词尾、小词之类的手段)遮挡一下暧昧关系,闹得主宾混淆,显得远不如欧洲语言严谨。

认真想来,父子原则其实说的是角色定位的法统唯一性,你做了张三的儿子,就不能当李四的儿子。你是谁的宾语,就不该再做其他词的主语,不要脚踩两条船,否则容易引起误会。如果遇到一种说法,单单从形式模式上无法区分是谁的儿子,那就是歧义结构,对应两颗不同的树,有两个不同的意思。西方语言中最知名的歧义结构叫做介词短语找老子(PP-attachment)的问题,它的形式模式是:V + NP + PP,其中介词短语 PP 的老子既可能是名词短语 NP,也可能是动词 V。譬如:

They saw the girl with the telescope.


歧义结构不违反原则,反而支持了这项原则。说明根据原则画的句法树可以把隐含的结构歧义清晰地表达出来。上述例句赶巧有双关语(pun)的特性,在句子层面两种意思的可能都存在(用望远镜看姑娘 vs 看那戴望远镜的姑娘)。多数情形是,文法层虽然有两种可能性,但语义配搭上却只有一种解读(语义消歧),譬如:

They saw [the girl with a hat].

They [hit [the nail] with a hammer].

这就跟三角恋爱一样,恋爱层面有三个角色(V,NP,PP)两组关系(『V,PP』,『NP,PP』),可通常只能有一种婚姻关系。谁与谁结合,决定于相互的吸引力(semantic coherence,语义和谐度,俗话叫谈得来)。显然,『the nail, with a hammer』的气味不相投,根本无法与『hit, with a hammer』比,前者的语义(带着锤子的钉子)不搭配,远不如(拿着锤子去砸 )自然然贴切。同理,在『the girl, with a hat』与『saw, with a hat』的较量中,前者更加般配,后者不 make sense。

仔细研究可以发现,所谓父子原则不过是在文法层次用归纳法总结出来的一种统计上带有一定普遍性的趋势,在逻辑语义的深层(大脑思想里)并没有这条约束。客观世界里面,绝少一个实体只充当一个角色。张三在父亲面前是儿子,在儿子面前是父亲,在公司是老总,在太太面前是丈夫兼车夫,等等。思想是客观世界的反映,所以多角色在语义上没有问题。那么为什么语言中常常强加这么一种文法的原则性,规定只能有一种合法角色?一种解释是,角色可以多,但在法理上应该只有一个为主,天无二日,世界太平。这叫好比某官员有隐藏的小三甚至小四在金屋里,可法理上的配偶只有一位,否则就违反原则,不成体统。


【补记】

又想了一下这个问题,我本来的解说的对的,后来为了趣味性,carried away,文末几句有误导了,应该修正
作者: 立委
日期: 08/07/2013 14:14:40

这个语言学文法结构的父子原则是由语言的交流本质决定的。一般而言,一个儿子一个老子的结构是没有歧义的,因此适应了语言交流的需要。如果语言中满是一子多父的情形,那么人理解语言将遇到重重歧义的困境,交流怎么能顺畅。

什么天无二日,脚不能踩两只船,小三小四不合法等等“法理”都是为了趣味牺牲了实质的笑话,不能当真。看样子,科普写作要防止不小心为了乐趣不知不觉就牺牲了正确性的做法。

再进一步说,虽然大千世界里同一个实体可有多个角色并与其他实体发生多种关系,然而当语言在反映(描述)这些角色和关系的时候,仍然基本遵循一子一父原则。其中的道理就是,文法是针对语句的,而不是针对篇章(discourse)的。一个被提到的实体在一个句子的有限范围内,通常只扮演一个角色,描述一种关系(例外自然是有的,譬如汉语中的兼语现象,但这类例外属于语言中少数现象)。要想反映实体世界的多重关系,人常用由多语句组成的篇章来描述。

人类的交流过程就是利用自然语言这个通讯工具(vehicle)编码与解码的过程。严谨的语言工具提供种种形式化手段(如,前后缀、小词、词序等)和文法范畴(如,格、数、人称、时态、语态及其一致关系),限制编码过程中歧义的产生,这样受众在解码的时候就可以比较容易理解说话人想表达的意义,达成交流的目的。也正是在这样的一个人类交流的背景下,才有文法中父子原则的自然显现和贯彻。父子原则有很多语言事实支持它,于是上升到原则,为语言学家所乐道。


【相关篇什】

 乔氏 X 杠杠理论 以及各式树形图表达法

【立委科普:自然语言parsers是揭示语言奥秘的LIGO式探测仪】 

【置顶:立委科学网博客NLP博文一览(定期更新版)】

转载本文请联系原作者获取授权,同时请注明本文来自李维科学网博客。

链接地址:https://wap.sciencenet.cn/blog-362400-714724.html?mobile=1

收藏

分享到:

当前推荐数:12
推荐到博客首页
网友评论5 条评论
确定删除指定的回复吗?
确定删除本博文吗?