切换到桌面版

范畴语法和《句法连通性》

范畴语法是一个非常重要的描述自然语言的形式化框架。它的基本思想是形式语义学中的组合性思想;它的基本结构是基于高阶函数所生成的句法成分。从形式上,范畴语法以归结为短语结构语法的一个变种,或者说二者是等价的。

范畴语法的思想,首次由阿伊杜凯维茨[1](Kazimierz Ajdukiewicz)——上世纪逻辑实证主义华沙学派(Lwow-Warsaw School)的重要人物——提出。他在1935年写下的那篇划时代论文:《Die syntaktische Konnexität》(句法连通性)[2],第一次提出将逻辑学方法引入自然语言的研究。这篇论文原文是用德语写成,收录在由阿伊杜凯维茨本人为主编的“Studia Philosophica”(哲学研究)期刊中。

为什么要研究这篇论文?首先,它开创了用形式化的方法,具体地说是用函数和演算作为工具研究自然语言的句法和语义。这一点,和22年后诞生的生成语法殊途同归。但是和生成语法不同的是,范畴语法并不是统一的语言学学派,产生、发展方式更像是数理逻辑,为解决问题A,提出方法S,A的问题没有彻底解决但S本身却提出了新的问题,开创了新的领域,新的领域成为新的学科,更成为其它新学科的理论基础。就范畴语法来说,阿伊杜凯维茨本义是在解决罗素在类型论中要解决的悖论和二律背反(antinomy)问题,特别是语义悖论的问题。按照Bar-Hillel的说法,就连阿伊杜凯维茨本人也没有想到这篇论文会对后世的语言学理论、特别是形式语法理论产生如此大的影响。但历史就是这样:《句法连通性》这篇论文的的确确成为了经典,既是逻辑学中的经典,也是自然语言句法研究的经典,范畴语法核心思想的确立始于阿伊杜凯维茨这篇论文。

同样和生成语法不同的是,范畴语法后来的发展是接力棒式的,阿伊杜凯维茨做了开创性研究,二战以后,由Yehoshua Bar-Hillel接过来,以《句法连通性》的基本思想作为主要框架,将结构主义语言学的方法引入其中,并加以扩充发展,成为更加强有力的语言描述工具;上世纪1958年,加拿大数学家Joachim Lambek发表了论文《The Mathematics of Sentence Structure》,以Bar-Hillel的理论为基础,利用群论作为工具,开创了当时称作“代数语言学”(algebraic linguistics)、后称作“句法演算”(syntactic calculus)的关于自然语言的形式化理论。1960年Bar-Hillel第一次提出以“范畴语法”作为这种新语法框架的名称,得到学界的广泛认同。

不过,真正运用范畴语法大规模研究自然语言则是1970年代以后的事情。这个倾向的背后,是许多语言学家开始对“生成语法理论”的不满与失望,以及以蒙太古(Richard Montague)为代表的形式语义学派的崛起。蒙太古的语义学一经提出立即引起轰动,成为在语义学领域的“生成语法”。但是这个语义学理论所附带的句法,则非常原始粗糙,这引来了众多语言学家、特别是研究生成语法的语言学家试图将生成语法的句法理论引入该语义理论的冲动,当时在这方面最积极的要算是同时师从乔姆斯基和蒙太古的Barbara Partee(芭芭拉·帕蒂)。不过,从生成语法转行到蒙太古语义论的Emmon Bach(埃蒙·巴赫)却将目光转向了范畴语法,认为范畴语法和蒙太古语义论都来自于逻辑学研究,而且可以统一地用一个approach对自然语言进行全面的句法和语义的研究。这样的研究,进一步吸引了一大批语言学家、逻辑学家和计算机科学家的加入,并对后来的生成语法产生了巨大的影响,例如GPSG(广义短语结构语法)、HPSG(中心词驱动短语结构语法),甚至对主流理论、亦即P&P理论也影响巨大,目前的MP(最简方案理论)在理论框架上已经和范畴语法的基本理念上非常接近。这其中,除了学术上的理论之外,也有许多令人难忘的个人恩怨和故事,不过这不是这里讨论的话题。

范畴语法在上世纪1980年代被广泛接受以后,开始有了新的发展,所谓“新的发展”,主要是扩大它的表达能力,能够描述更多的自然语言现象。和生成语法不一样的是,范畴语法没有领军的权威人物,故造成了各自为政,产生了许多不同的分支。

由于范畴语法本身的性质,从事其研究的不仅仅是语言学家、逻辑学家、计算机学家甚至包括数学家、哲学家,大家按照自己的专业从不同的方向基于不同的动机和目的,改造、扩展范畴语法,造成了诸多加了形容词的范畴语法,目前广泛流传的范畴语法主要变种有下列这些流派:
(1)组合范畴语法(Steedman 1987, 2000)
(2)类型范畴语法(Morrill 1994, Moortgat 2010)
(3)pregroup语法(Lambek 1999,2008)
(4)抽象范畴语法(de Groote 2001, Muskens 2001)
(5)对称范畴语法(Bernardi and Moortgat 2007)

这些流派的共同起点是所谓的“古典范畴语法”,亦即,以阿伊杜凯维茨的《句法连通性》为开端,经Bar-Hillel的论文《A quasi-arithmetical notation for syntactic description》(一种描述句法的准算术式表示法),到Lambek的论文《The Mathematics of Sentence Structure》(句子结构的数学)。通常,Ajdukiewicz和Bar-Hillel的两篇论文,称作是范畴语法的古典形式,简称AB语法。而Lambek的的代数语言学,又称作Lambek Calculus,作为一种独立的理论影响着后来所有有关范畴语法的研究。可以说,现代范畴语法的起点,始于Lambek Calculus。但是从概念上理解范畴语法,还是应当从AB语法开始。

本系列笔记,准备对这三篇论文,做一个俯瞰式的解读,这对于理解范畴语法的现代形式可以提供理论源头和背景的帮助。如果用一句话概括范畴语法的实质,那就是:范畴语法的核心概念是函数,是基于高阶函数的语法框架,因此这个框架可以很容易地转写为lambda演算,进而用Lisp、Haskell之类的程序设计语言描述。

【注1】关于Ajdukiewicz的发音和汉字对译,这里没有按照国内流行的翻译,而是我在google translate上获得的波兰语的发音后自己对译的。可以说最接近原语。

【注2】本论文的英译版,收录在Storrs McCall编辑的《Polish Logic 1920-1934》,译者是Horst Weber。


【参考文献】
1. K. Ajdukiewicz: 1935. ‘Die syntaktische Konnexität’ <Studia Philosophica> Vol. 1 pp. 1-27.
2. Y. Bar-Hellel: 1953. ‘A quasi-arithmetical notation for syntactic description’ <Language> Vol. 29, No. 1 pp. 47-58.
3. J. Lambek: 1958. ‘The Mathematics of Sentence Structure' <The American Mathematical Monthly> Vol. 65, No. 3 pp. 154-170.
4. M. Steedman: 1987. ‘Combinatory Grammars and Parasitic Gaps’ <Natural Language & Linguistic Theory> 5, 403-439.
5.M. Steedman: 2000. ‘The Syntactic Process’ MIT Press, Cambridge MA
6. G. Morrill: 1994. ‘Type Logical Grammar: Categorial Logic of Signs’ Springer
7. G. Morrill: 2010. ‘Categorial Grammar: Logical Syntax, Semantics, and Processing’ OUP Oxford
8. J. Lambek: 1999. ‘Type Grammar revisited’ <Logical Aspects of Computational Linguistics> pp. 1-27.
9. J. Lambek: 2008. ‘Pregroup Grammars and Chomsky's Earliest Examples’ <Journal of Logic, Language and Information> 17 (2): 141–160.
10. P. de Groote: 2001. ‘Toward Abstract Categorial Grammars’ <Proceeding ACL '01 Proceedings of the 39th Annual Meeting on Association for Computational Linguistics> pp. 252-259.
11. R. Muskens: 2001. ‘Lambda Grammars and the Syntax-Semantics Interface’ <Proceedings of the Thirteenth Amsterdam Colloquium>Ed. by Robert van Rooy and Martin Stokhof. Amsterdam, pp. 150–155.
12. R. Bernardi, R & M. Moortgat: 2007. ‘Continuation Semantics for Symmetric Categorial Grammar’ in D. Leivant & R. de Queiros (eds), <Proceedings of the 14th Workshop on Logic, Language, Information and Computation> (WoLLIC07) Springer, New York






推荐人

京ICP备14006957 Copyright @ 2007
中国科学报社 All Rights Reserved
桌面版