赛义甫的个人博客分享 http://blog.sciencenet.cn/u/saif 逻辑学、数学、计算科学、语言学和哲学——关于形式科学的思考

博文

HPSG理论方法论基础:语言学理论的性质和研究方法

已有 4000 次阅读 2016-2-12 06:02 |个人分类:语言学|系统分类:科研笔记| 语言学, HPSG

HPSG理论,亦即,中心词驱动短语结构语法,本质上是对《句法结构》思想的继承和发展,也是继生成语义学派之后第二次对Chomsky理论的反思。其结果是彻底抛弃“转换”(transformation)的概念以及由此产生的派生理论,在承认语言研究是研究【语言知识】(linguistic knowledge)的基本理念下专注于对语言理论的形式化、精密化和严格化的尝试。如果说《句法结构》只是在理论上提出了语言学应当走向更加严谨的精密科学问题,HSPG就是在这个思想下一次伟大的实践。关于这一点,如果有兴趣可参考本人《我的<句法结构>读书笔记》。

HPSG全面继承了被后来的主流理论所抛弃的《句法结构》的这个基本原则,并有所发展,将这个原则理论化、系统化,在采纳了其它形式语法理论、数理语言学和数学、逻辑学、理论计算机科学、人工智能的工具和方法之后为语言学理论建立了一个全新的、可以媲美任何其它自然科学的基础框架,使这个框架具有了科学研究的第一要素:可证伪性。

语言学理论走向形式化、精密化,它的一部分特别是句法、语义等核心内容应当成为形式科学一部分,这一理念首先是在《句法结构》中提出来的:
  “为语言结构建立精确的模型本身就可以在发现过程中起很重要的、正反两方面的作用。用一种精确的、但不适任的形式化阐述推导出一个无法接受的结论来,那么我们往往由此能揭示不适任的真正根源因而也获得了对语言材料更深刻的理解。从更积极方面来说,一种形式化的理论,除了能解决理论设计明确要解决的问题之外,或许还可以自动解决许多这些问题之外的问题。而模糊不清的、囿于直觉的概念即不能引出荒谬的结论也无法提出新的、正确的结论,因而这类概念在两个重要方面都没有用处。精确严谨地阐述所提出的理论并把这种理论严格地应用到语言材料上而不想靠靠临时凑合应时的调整或不严谨的阐述来避免那些难以接受的结论,这样的研究方法可能会更有成效,而有些语言学家无法认识到这一点,质疑精确、严格语言学研究的价值。”

这段论述可以说是生成语法理论的总纲,基本路线。遗憾的是,乔氏本人并未严格遵循这一点。从标准理论开始,理论的定位从语言结构理论变成了人脑中的内在语法、语言能力的研究,语言学的研究被渲染成“认知学的革命”。从上个世纪70年代末到80年代,随着更多的学者加入到生成语法理论的研究,研究的深度和广度不断扩大,一些更基础的深层次的问题被提了出来。首先,什么是转换?什么是生成能力?这些概念的正当化基础在哪里?生成语法作为一门自称是“精密科学”的理论,它本身的理论基础又在哪里?随着乔氏做过贡献的形式语言理论在计算机科学的成功,一些人开始用同样的方法研究转换语法:试图为这个理论找到一个像短语结构语法那样的数学模型。在“乔姆斯基层级 ”理论(Chomsky Hierarchy)中,有限状态语法和上下文无关语法在形式语言理论中都得到了充分的研究,而乔氏提出的新语言结构模型--转换语法却无人给出一个相应的数学模型。按理说这是乔氏本人的任务,就像他以前对前两个语言模型所做的研究一样。不过遗憾的是当时的乔氏的兴趣已经转向,更热衷于人脑和语言的关系,将生成语法的地位上升为对人类获得、产生、理解语言过程的一种外在建模,并认为这种意义上的转换生成语法是17世纪Port Royal理性主义语法学派“新的觉醒”。

而探讨“转换语法”的理论基础问题已经提不到乔氏的日程。这样,直到1970年代,才有人开始认真严肃地研究这个问题:他们就是Stanley Peters和R.W. Ritchie。二人的研究方法和乔氏一样,试图为新的语法模型--转换语法找到一个相应的数学模型。Peters和Ritchie在1973年的论文《On the Generative Power of Transformational Grammar》中,第一次形式化的证明了所有递归可枚举字符串的集合都属于转换语法所生成的语言(every recursively enumerable set of strings is the language generated by some transformational grammar)。

从此“转换语法”从科学理论的神坛上跌落下来,到了上世纪1980年代,一批独立思考的生成语法学家开始抛弃“转换语法”,首先是回归短语结构语法,因为这个语法的数学模型--上下文无关语法(CFG)自1950年代以来在理论计算机科学中已经十分成熟,上世纪1970/1980年代非常著名的计算机编程语言Algol 60就是第一个基于CFG设计的,并且大获成功,从此CFG在理论计算机科学领域深入人心。在这种情况下语言学界提出回归短语结构语法自然赢得了许多学者的共鸣。其中最著名的就是由Gazdar、Klein、Pullum和Sag提出的“广义短语结构语法”(GPSG)。这个语法理论的最大特点,就是在坚持“生成语法”基本原则的同时,彻底放弃了“转换”的概念,重申了《句法结构》中的宣言:语言学的任务就是建立关于自然语言的语言结构一般性理论,通过该理论得到明确的对特定语言的描述。这个理论的基本框架应当具有证伪性,而研究方法则采用了数理逻辑中模型论:首先定义对象集,再递归定义对对象集的操作,以及表达式的“良形”(well-formedness)定义,最后对符合良形定义的表达式赋予语义解释。

以GPSG为代表的的反主流理论的生成学派,第一次明确宣告:生成语法理论的精神实质在《句法结构》所设定的目标:形式化、明确化、精密化,使语言学研究迈向自然科学的方向,因而生成语法理论的发展在理念上要向《句法结构》回归,在理论框架上要向短语结构语法回归,在方法论上要向蒙塔古语法回归。反过来,GPSG认为乔氏当时的GB理论并不属于GPSG作者们所定义的“生成语法”,理由是:

"there are little signs of any commitment to the explicit specification of grammars or theoretical principles in this genre of linguistics"。

继承了GPSG传统的HPSG完全接受了这个理念,这个理论一开始就把语言学理论的精确、明确和严格作为第一要求,从1987年第一次提出这个理论开始到1994完成理论的系统构建,全面完整地提出语言学理论的基本性质和科学方法论的理论。

1. 语言学理论必须要和其它自然科学、特别是物理学一样,严格定义研究范围(empirical domain),研究对象以及相应的方法。具体地说就是:
1) 设定要研究的“现象”(phenomenon),得到所要研究的范围(empirical domain);对确定了的研究范围装入(populate)研究对象;
2) 利用数学(特别是近世代数中的结构概念)对这个研究范围中的对象建立模型(modeling)。
3) 得到对这个模型的原始数据,对这个模型进行研究形成理论(theory)。
如果表示(representation)这个理论的语言是自然语言,则这个理论是非形式化的;
如果用一套严格的形式语言将理论表示(reprensenting)出来,则这个理论是形式化的。最极端的形式化,则是以一阶谓词逻辑为语言的公理系统。
4) 理论的作用是对来自研究范围中的新数据进行预测(prediction),看结果是否符合预期。

总之,任何科学理论的基本要素都是:研究对象(研究范围)、模型、形式化理论。一旦建立了模型,理论将不再直接研究现象本身而是研究建模的结构,或者说建模的结构解释、阐述理论。

在《Head-Driven Phrase Structure Grammar》(Pollard & Sag: 1994,以下简称PS-94)中,作者以天体物理学中太阳系轨道运动物体为例,对上述的原则进行了具体的说明:



在这个图中,研究范围是多体(或称N体)系统的运动问题,通过建模(modelling)过程得到的模型是Hamilton向量场;研究对象是多体质点,它们的质量、速率、方向等运动属性。而理论则由①多体系统微分方程;②公理化集合论;③一阶形式语言构成。从这个图可以看出整个研究的方法是这样的:

确定研究范围和研究对象,建立理论,用理论对其建模,其方法论用的是数理逻辑中的模型论方法,得到的是一个向量空间;从对研究范围的对象的初始研究得到对新事实的预测能力。

理论的关注点在于模型,但是能够对研究对象本身的规律产生预测能力。PS-94的结论是,就方法论而言,语言学理论应当具有和这个多体力学相同的研究范式(paradigm)。

有了这样的类比,HPSG提出包括语言学理论在内的一般科学的研究方法论就是三要素:理论、模型和研究范围(impirical domain)。具体到语言研究,HPSG理论的研究范围只限于句法和语义的研究,在这个范围内,语言对象是特定的话语(utterance)片段。建模的结果相当于多体力学中向量的概念,在HPSG中称作【sign】。【sign】是研究所有语言对象的最基本单位。描述【sign】的工具就是【特征结构】,而【特征结构】的基础是【特征逻辑】(feature logic) -- 一种在在上世纪1980 -1990年代发展出来的新的逻辑系统。按照这样的描述,HPSG的语言研究范式就有了和上面天体力学研究范式相似的构造和关系:



在这个图景中,对语言对象直接的描述是HPSG本身的语法理论,递归理论和特征逻辑。语法理论包括了若干“普遍原则”(universal principles)、“规则程式”(rule schemata);递归理论用来构建多层次的复合“特征结构”;而“特征逻辑”则是描述【sign】的工具。

现在我们关注的是方法论和研究工具而不是这些细节。

2. 和其它科学一样,HPSG在方法论上的另一个原则称作“概念节俭”原则 (ontological parsimony)。这个原则的基本思想就是“简化”(simplicity),理论应当用最少的概念说明尽可能多的事实(这个事实应当是模型中出现的事实),尽量不要设定观察不到或没有实证可能性的概念。当然,这一点不是禁忌,如果为了说明理论必须要设定则尽可能少用。具体到生成语法理论,早期的理论设定了大量的短语句法规则和转换规则,每一个规则都要用到相应的中间概念,因为根据乔姆斯基范式(Chomsky normal form),在一个产生式的推导过程中,如果给定两个规则
(1) A → BC
(2) A → α
那么派生所用的资源则是:
       1.长度为n个字符串需要n次A → α 的派生,因此需要n个语法变元;
       2.n个变元需要n-1次A → BC 的派生(从S开始,每次派生增加1个变元,增加n-1次);
       3.由1和2得知,长度为n且满足乔姆斯基范式语法的字符串需要2n-1次派生。
(关于乔姆斯基范式的介绍,引用了维基百科的内容)
这里,每一个“语法变元”实际上是为派生该字符串所使用的中间概念,也就是说是在模型内观察不到的概念,这显然是与“概念节俭”原则相违背的。

3.语言学理论应当将语法和语言处理的理论分离,将二者看做是有联系但完全不同的理论体系。由语言学理论所提供的语法,应当是对语言处理中立的(lanuage process neutual)。为什么?因为“语言处理”的本质是语言的使用,而作为语言知识存在的语法在语言处理的过程中只是其中的一个要素之一。语言处理,包括了话语产生(utterance producing)--说话者;话语理解(comprehension)--听者;话语转换(translation)--改述、翻译者;话语操作(manipulation)--语言游戏、修辞等,但基本方面就是话语的产生和理解两个侧面。如果语言的语法是面向处理的,那么偏重产生和理解两个方面任何一个方面都是不经济的,因此语法的设计应当是不考虑话语的产生和理解过程的。换句话说,一个语法只是静态地描写语言对象的语言信息,这些信息应当是高度描述性的,和研究范围内的话语的成分结构(constituent structure)无关,语法应当是语言知识模型,是对具体话语结构高度抽象。这一点和面向对象的编程范式非常相似:面对现实世界千变万化的各种不同问题,这种范式只设定了若干最基本的概念,如“类”、“对象”、“接口”等,以及对这些概念关系的定义:继承、相关、包含、注入等。这样高度形式化、抽象化的结果使得一套编程语言、加上设计模式和软件工程的方法就可以应对从电信到金融、从卫星控制到学生成绩管理等性质完全不同的问题。

将语法与语言处理分离理论的另一个理由,如上所述,语法应当是对语言对象的语言信息的静态描述,而语言处理则是语言使用的动态操作,其中各种信息交织在一起,包括语言知识、百科知识、上下文知识、话题焦点知识等。如果将语法与语言处理绑定在一起,那么就面临着艰难的选择:语法是描述话语产生还是描述话语理解?因为这两个过程从顺序上正好是相反的。从语言学的角度,人们对语言处理机制的了解远不如对语言结构的了解。

基于这样的理由,语法的设计,其基本元素必定是对处理中立的(process neutral or unbiased)。而已知的最好的处理中立的方式就是将语法设计成一个声明式的制约系统。
所谓声明式,就是只规定某个语言对象具有某个属性,至于这个对象的这个属性在句法操作中有什么样的作用则一概忽略。其实现代web编程的三大利器:HTML、CSS和Javascript和这样的语言理论非常相似:HTML是一种语言,定义了一个web应用其本要素,相当于我们这里语法;CSS则规定了这些应用元素的外在表现形式,相当于我们语法中的规则程式;而Javascript则定义这些web元素的行为,就像我们刚在谈到的语言处理理论。

早期的生成语法理论恰恰是没有理顺这样的关系(当然早期的计算机编程也是如此),例如转换语法,是一个典型的瀑布型的语言处理理论,从一种结构到另一种结构,是利用转换操作进行的,而转换规则的使用必须服从严格的顺序规定。而且这个语法模式完全是偏重话语产生模式的,如果利用这个语法模式处理理解过程,则必须反向使用这些转换规则,这基本上是一个无法完成的工作。

因此声明式语法,将为以后的语言处理理论提供坚实、灵活的语言知识框架。HPSG理论,至少1994年的版本不会直接提供语言处理的基本框架,但这个理论整体必须满足语言理论的可确定性条件(decidability)。亦即,某一特定语言中的待定表达式能否被语法赋予一个良形结构(是否合法)必须是由算法可确定的,换句话说就是通过有限的、被定义的步骤就可以确定的。由于严格的算法只能对精确定义的语言对象有效,因此能否展现理论的可确定性完全取决于所选的的形式语言,例如HPSG的形式语言是【特征逻辑】语言。
正是这个可确定性条件将语言理论中的语言知识和语言处理部分分离。

HPSG对语言知识的定义是:递归可定义的语言类型系统(a recursively definable system of linguistic types)。关于这个定义的确切含义我们会在后面详细谈到,这里只提示一点:语言知识研究的不是某个特定的语言事件(event)或token(用标),而是从个别语言事件和token(用标)的抽象出的类型。

而对语言类型的哲学属性我们这里不做评论,在历史上的争论大致分为两派:唯理论和实在论,争论焦点是语言类型应当属于心智对象还是心智外对象?索绪尔、乔姆斯基属于前者,而布龙菲尔德、卡茨和巴威斯当属后者。

参考资料
《Head-Driven Phrase Structure Grammar》- C. Pollard & I. Sag 1994
《Information-Based Syntax and Semantics Volume 1》 - C. Pollard & I. Sag 1987
《An Informal Introduction to HPSG》- Wolf Paprotté
维基百科《乔姆斯基范式》
维基百科《Chomsky normal form》
(完)





https://wap.sciencenet.cn/blog-2349385-955662.html


下一篇:闲聊语义学
收藏 IP: 205.206.16.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-10 13:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部