语料库翻译研究+认知空间分享 http://blog.sciencenet.cn/u/carldy 探索翻译研究新途径,反思语言认知研究

博文

基于自建英汉翻译语料库的翻译明晰化研究(中国翻译2010第1期)

已有 10563 次阅读 2010-12-17 16:26 |个人分类:基于语料库的研究汇总corpus-based studies|系统分类:论文交流| 英汉翻译, 翻译学, 语料库翻译学, 明晰化研究

【备注】这里录下的是本人与肖忠华老师合作的论文,《中国翻译》2010年第一期已经刊发,可惜因为篇幅原因,编辑老师把我们的论文开头结尾都给掐掉了,这里补上,供大家参考:

基于自建英汉翻译语料库的翻译明晰化研究*

戴光荣 肖忠华

福建工程学院,浙江大学

 

摘要:当前基于语料库开展英汉翻译明晰化研究不多,且多是译介西方研究成果。本研究采用如下三类语料库:汉语母语语料库、汉语译文语料库,和句对齐英汉平行语料库开展明晰化研究。通过量化研究,对词类明晰化翻译加以探讨,并通过例证,探讨其翻译策略,旨在为翻译教学与研究提供一种可描写性、可操作性参考。

关键词:明晰化,语料库翻译研究,翻译策略,平行语料库

A Corpus-based Investigation of Explicitation in Translation

Abstract: The researches on explicitation of bi-directional translation between Chinese and English based on corpora are rare and most which are introductions to westerners’ theories. This research is based on three corpora, i.e., Native Chinese Corpus, Translational Chinese Corpus and sentence-aligned English/Chinese Parallel Corpora. The paper discusses the explicitation at the lexical level with the help of quantitative research and offers illustrations about the translation strategies from the corpora which can shed light on the descriptive and operative suggestions for translation study and teaching.

Key words: explicitation, corpus-based translation studies, translation strategy, parallel corpora

 

1. 问题的提出

无论是汉语还是英语,都有一种“文贵含蓄”的特征,含蓄即“隐”。古代文论家刘勰在《文心雕龙·隐秀》中指出:“隐也者,文外之重旨也;秀也者,篇中之独拔者也……夫隐之为体,义生文外,秘响旁通,优采潜发,譬爻象之变互体,川渎之韫珠玉也。” “情在词外曰隐,状溢目前曰秀”,所谓“隐处即秀处”(祖保泉,1993)。“隐”与“秀”,是永恒的矛盾统一体。

法国著名翻译家勒代雷(Lederer2005)指出:语言符号的构成成分可以分解为显性成分与隐性成分两个部分,这两种成分随意组合,产生符号的意义。这样一来,同一文本的不同语言版本具有完全重合的显/隐意义结构的可能性几乎完全可以排除。在翻译的时候如何处理这些“含不尽之意于言外”的语言符号,是否有必要替目标语读者消除所有的含蓄之意,把原文意义完全明晰化?这些都值得译者及翻译研究人员认真关注。

 

2. 关于翻译中的明晰化研究

翻译中的明晰化,有学者将其称为显化(explicitness/explicitation),又译外显化、明朗化、明示等(柯飞,2005;吴昂 黄立波,2006 等)。对明晰化现象的关注,以Baker(1993)为标志,可以分为前语料库与基于语料库两个时期(黄立波,2007)。

前语料库时期有关明晰化的代表性研究集中在对该术语的界定与探讨上。明晰化是由 Vinay Darbelnet (1995) 共同提出的,是指这样一种现象:目标文本往往以比原文更明确的形式来陈述原文本的信息,是译者在翻译过程中增添解释性短语或添加连接词等来增强译本的逻辑性和易解性(见Shuttleworth & Cowie1997)。

最早提出明晰化理论假设的是Shoshana Blum-Kulka,其在《翻译过程中衔接与连贯手段的转换》中指出:成功的翻译需要对语篇和话语进行复杂的处理,译者对原文进行阐释的过程可能会导致译语文本比原语文本冗长。这一冗余现象可能是由于译语中提高了衔接上的明晰化程度造成的(Blum-Kulka, 2000)

Nida & Taber(1969)也对明晰化做了阐释:认为好的译文往往多少比原文长,主要是因为在翻译过程中,译者会通过明示原文中的隐含信息,在适当限度内增加译文的冗余度。

基于语料库的明晰化研究不同于前语料库研究的特点在于:以各语种大规模翻译语料库为基础,对相关明晰化假设进行实证研究。对英语译文进行明晰化研究的,以Baker (1993, 1995, 1996, 1998, 2000)的研究为典型代表,另有Øverås (1998)Klaudy(1998)Olohan (2004)Kenny(2001)等。对汉语译文做出相关研究的代表有王克非(2004)、柯飞 2005)、贺显斌(2003)、胡显耀(2005,2006)、黄立波(20062007)、刘泽权(2008),Wang Kefei, Qin Hongwu (2008),Xiao. Z & Yue Ming(2008),台湾学者W. Chen(2008)Shih Chung-ling(2008)等。

3.基于自建翻译语料库的明晰化量化研究

   为了达成英汉翻译明晰化现象的可描写性、可操作性,为同类研究提供相关参考数据,并提供可行性参考建议,本文基于上述研究的基础上,采用如下三类语料库,即汉语母语语料库、与其对应的汉语译文语料库,和句对齐英汉平行语料库开展明晰化研究。

汉语母语库拟使用“兰开斯特现代汉语平衡语料库”(LCMC)。该库是由英国兰开斯特大学在英国经济与社会研究基金会资助而建立的现代汉语书面语平衡语料库,总计一百万词(McEnery and Xiao 2004)。汉语译文库拟使用“浙大汉语译文语料库”(ZCTC)。该语料库严格按照LCMC的抽样标准建立,用于开展翻译语言和非翻译语言的对比研究。译文库包含500个以同样比例从相同的15个语域抽取的2000词左右的译文样本,总计也是一百万词。为避免由于多种源语的影响而使语料分析过于复杂,译文库将只包括英译汉文本。为方便数据收集,采样年代将在LCMC1991年前后三年基础上放宽,包括1991年至2000年出版的译文和译著。同时,尽量采用已有电子文本的作品,出于平衡语料目的所需的少数无电子版的文本通过OCR扫描获取(Xiao, He and Yue 2008)

平行语料库采用自建句级对齐英汉平行语料库。该语料库分为如下几类:汉语政府公文及英译(如党的17大报告)、汉语法律文本及英译、英语演讲名篇及汉译、英语哲学文本及汉译、英语政府公文及汉译等,总计达100万词左右。

通过检索与统计,我们应证了王克非(20032004)的研究发现:无论英译汉或汉译英,都呈现目标文本扩增的特点。利用检索软件对平行语料库中的文本进行统计后发现:中译英之后,文字量在不同程度上增加了。图一、图二是wordsmith4.0对党的17大报告(中英文)词表处理的统计结果截图:

图一:17大中文版词表

   

图二:17大英文版统计图

表格第一行是文本名称,第二行是文件大小,第三行是文本中的词次(tokens),第四行是用于创建词表的词次数,第五行是类符(types)数,第六行是类符/词次比(TTR),第七行是标准化的类符/词次比,第八行是标准化的类符/词次比的标准差。汉语文本总规模为121,810字符,其中用于创建词表的词次数为13,450,英语译文总规模达137,612字符,其中用于创建词表的词次数为20,848,词次数增加了近7000。汉语文本的类符/词次及标准类符/词次比分别为17.20/44.29,高于英语文本的12.44/38.17,也表明汉语文本的词汇密度大于英语文本的词汇密度。

从统计结果来看,英译汉同样存在文本扩增的现象。图三与图四显示的是英语24篇哲学名著翻译成汉语的统计数据。

 

图三:哲学名著语料库(英语文本统计数据)

图四:哲学名著语料库(汉语文本统计数据)

英语文本词表用词为30,946,汉语译文词表用词达65,969,词数翻了一番。英语文本的类符/词次比及标准类符/词次比分别为13.89/39.47,高于汉语译本的5.51/26.57,也表明汉语译本的词汇密度小。

以上数据是从宏观统计的角度入手的。微观操作层面上,笔者在利用Trados WinAlign进行文本对齐时,得出如下发现:英汉对译在语句层面的对应比例11居多,也存在一对多的情况,这些受中英文句子在断句、标点上差异的影响。英文在句法上比较严格,而汉语句子重意合,语句中多流水句,往往一句话中出现很多小句,译成英语时,就出现了一对多的现象。图五是Trados WinAlign 显示出来的17大报告一对多情形的截图

图五:17大报告中英对齐截图

   Wang Kefei, Qin Hongwu2008)利用北外通用大型汉英对应语料库开展翻译语言特征研究,发现无论从字符、类符,还是从标注类符/字符比,汉语译文都要高于汉语原文,而且译文的句长要高于英语原文,这说明了翻译过程中添加相关的信息,从而出现了明晰化特征。如图六:

 

 

字符数

类符数

标准类符/字符比

字长

句长

句段长

汉语原文(文学)

466,414

23,047

46.72

1.36

25.46

6.02

汉语原文(非文学)

222,758

11,066

41.92

1.76

27.05

7.20

汉语原文

689,172

28,437

45.19

1.49

25.95

6.35

汉语译文(文学)

578,148

24,213

47.36

1.44

25.81

7.00

汉语译文(非文学)

496,218

26,174

47.65

1.64

31.52

8.58

汉语译文

1,074,366

36,354

47.49

1.53

28.27

7.65

英语原文(文学)

546,632

22,409

43.21

4.26

16.76

6.79

英语原文(非文学)

487,673

25,739

44.37

4.87

20.24

9.32

英语原文

1,034,305

35,695

43.75

4.54

18.23

7.78

图六:北外汉英对应语料库部分统计数据

 

以上这些数据从宏观上给我们这样的启示:无论是英译汉还是汉译英,明晰化在翻译语料库中是客观存在的。

各类数据给我们研究者以宏观上的启示,具体到微观可操作层面,需要对大量例证加以归纳分析。这些扩增后的译文,其明晰化特征有些体现在词语层面上,有些体现在句级层面上,有些体现在语篇层面上,甚至还体现在语音层面上。限于篇幅,下文重点探讨词类明晰化及翻译处理策略,其他层面的明晰化另行讨论。

 

4. 词类明晰化及翻译处理策略

上文提到的Klaudy(1998)将明晰化分成强制性明晰化、非强制性明晰化、语用明晰化和翻译内在明晰化Vanderauwera1985)也提出各种明晰化策略:扩充压缩讯息、增加“强调词”及“连接词”、增加额外讯息及解释、使用精简指涉名词代替原文之代名词、清楚指出地理名词等。这些研究成果,具体运用到英汉互译明晰化研究,需要译者做出准确判断,进而做出抉择。

通过检索,我们发现,利用语料库进行词义辨别,进而做出明晰化翻译,非常便利。与传统的借助词典进行翻译的方法相比,基于语料库的方法具有不可比拟的优势。翻译中的词义辨别,大多数译者会求助于各类词典。基于语料库基础上的词义辨析,例证比词典更丰富,可让译者根据不同的语境与搭配,更好地区分词义(戴光荣,2008)。在指导学生翻译“小康”一词时候,发现学生对该词的理解不够全面。通过检索发现:“小康”一词的最早出处是《诗经》:“民亦劳止,汔可小康。”小康原意是指古代自然经济条件下的一种衣食无忧的生活状态。该词的不同搭配,会有不同的含义,即使是“小康社会”,也有不同的英译:“a well-off society (16大报告) a moderately prosperous society(17大报告)”等。“发展”一词也一样:

(1)他是一个有发展前途的人。He is a man of possibilities.

(2)在生意发展得如此迅猛时,我们需要时刻保持联系。We need to be in constant contact while the business is expanding so rapidly.

(3)国家压倒一切的目标是发展核电。An overriding national goal is the expansion of nuclear power.

(4)按照传统说法,化学已逐步发展成了四大分支:有机化学、无机化学、物理化学和分析化学。Traditionally chemistry has evolved into four provinces: organic, inorganic, physical and analytical chemistry.

(5)不过,发展也带来了新的问题和顾虑。Growth, however, brings new problems and concerns.

通过不同例证,可以让译者对于“发展”一词的不同语境、搭配有了一个清晰的认识,从而为准确翻译提供前提。可以说,翻译语料库本身就是帮助译者对语言进行明晰化理解的便捷有效的工具。

4.1.指示代词+数词+范畴词/属性词”结构明晰化

汉语译文相比汉语原文来说,增加了许多有标记性的词汇。有学者(Wang & Qin, 2008)统计出在汉语译文中,“指示代词+数词+范畴词/属性词”这样的结构出现频率远远高于汉语原文,如图(七)所示:

 

   

MI

  

MI

 

1010

0.035

334

0.019

 

491

0.09

39

0.012

123

0.017

 

 

图七

在汉语原文中,这类结构一般与单音节词搭配,如“点////年”等, 有趣的是,在汉语译文中,这类结构大多与双音节词搭配,如“问题/条款/事实/目标/领域/计划/过程/观点等。这也表明,相比汉语原文来说,汉语译文更趋向于使用双音节词。这也可以从LCMCZCTC的统计表看出来:LCMC单音节词出现次数为412597ZCTC单音节词出现次数为403808(每百万词次多9789次);双音节次则相反,ZCTCLCMC多(百万词次)16010次。

语料库

/类符

单音节

双音节

三音节

四音节

四音节以上

LCMC

类符

3743

26245

6543

3611

478

字符

412597

365263

26525

11245

2069

ZCTC

类符

3277

20444

5143

3058

1492

字符

403808

381273

27853

9654

3446

图八:LCMC/ZCTC音节词次比

 

4.2. 抽象概念词后面需增加范畴或属性词,更好传译出原语含义

汉语译文明晰化还体现在过度使用部分具有解释性或者概括性的词汇,具体体现在添加范畴词或属性词,如“作用/状态/行为/作法/任务”等。另外表示事务特性的“性”(相当于英语中的词缀“–ness/ -ity)。检索结果表明,汉语原文(文学类)中,每千字出现“性”的次数为2.9,而在汉语译文中高达5.2。这些范畴词的运用,也体现出了英语对于汉语译文的影响,进而会影响到汉语。

我们把上述范畴词作为检索项,从LCMCZCTC得出如下的数据:

从统计数据可以看出,汉语原文语料库中,“作用”一词共出现460次,但是表示抽象意义的,只有56次,汉语译文语料库却多达88次。

试看例句:A thin coat gives little protection against the cold.

(一件薄上衣没有什么御寒作用。)

Few can deny the impact of his leadership.

(几乎没有人能否定他的领导作用。)

Furthermore, we concur with Keshler and Holmnitz that these bacteria may protect the organism.

(此外,我们同意Keshler and Holmnitz的意见,即这些细菌有可能对生物体起保护作用。)上述句中,“作用”一词,属于对前面抽象概念的明晰化,让译语读者更加容易理解源语含义。其他几个检索项都出现类似的明晰化现象,请看如下检索数据:

 

语料库

作用

状态

行为

LCMC

46056

12580

18157

409369

ZCTC

39888

10185

31591

405370

图九:范畴词/属性词的统计数据

 另如:The stability is essential for the promotion of economic growth in a country.该句中的stability,须把它的内涵明晰化:“一个国家一定要有稳定的形势,才能把经济建设搞上去。”

汉语中常见的范畴或属性词有除了上述的“作用/状态/行为/性”等词之外,还有如“心理()/活动/建设/任务/过程/现象/因素/领域等。其他例证如assimilation同化(作用)、oxidation 氧化(作用)、fault-finding 吹毛求疵(的作法)、madness疯狂/愚蠢(的行为)、fatuity顽愚(状态)、愚蠢(的行为)、backwardness 落后(状态)、favoritism徇私(作风)、loftiness崇高(的气质)、necessity必要(性)、readability可读(性)、correctness 正确(性)、dependence 依赖(性)等,不一而足。

 

4.3. 人名后面增译解释性内容,使译文符合汉语习惯

英语翻译成汉语的时候,遇到人名时,我们除了要注意译名规范化之外,部分情况之下,还要对该人名所蕴含(如该人从事的工作性质、该人的作品名称、或者提出的观点、意见等)的信息加以明晰化出来,这样才能符合汉语的习惯,适合汉语读者的理解与认知方式。

通过检索自建英汉平行语料库,我们的假设得到了印证。例如:

According to Honeyman, the Hessians had done nothing to build up defences in Trenton.该句中的人名Honeyman,应该具体化为该人所从事的工作或增译相关含义:

根据霍尼曼的情报,特伦顿里的雇佣军没有修筑任何防御工事。(乔海清,1999)

According to Sokal, phrenology owed much of its success to practitioners who gave character readings “so vague and general that they could apply to almost anybody”.    (根据梭卡尔的观点,颅相学之所以成功,归功于颅相学从业者们给人开出的诊断是“含糊且带有普遍性,几乎能适合任何人”。)

4.4. 语法形态标记明晰化:

在检索翻译语料库当中发现,一些时间副词,比如“正”(in the process of), “已”(already), “已经”(already), “一直”(always)等,大都与体标记词如“着//“过”共现。这体现出翻译语料库的明晰化趋向:通过“着//过”等标记形式,表明英语中完成时态、完成进行时态方面的含义。台湾学者Wallace Chen(2008)通过比较科技翻译语料库发现:汉语译文相比汉语原文来说,使用更多的体现逻辑关系的连词,如“而[and], [but],因为[because],所以[so],[and],如果[if],因此[therefore],但是[however]….

具体考察连词的使用上,发现译文更趋明晰化。通过比较LCMCZCTC的连词使用情况,我们发现:作为翻译语料库的显著特征之一就是:ZCTC每万词次平均出现率为306.42,相比LCMC243.23)来说,具有显著差异性(LL=723.12. d.f=1., p<0.001)

 图十:汉语原文语料库与译文语料库连词使用统计表

 

5. 结语

明晰化(显)与隐含化(隐),是一对矛盾统一体。语言有共性,翻译时应将原语与译语的共性利用到最大限度;语言又有鲜明的民族色彩,翻译中,须坚持在忠于原文的基础上进行明晰化处理,以调整译文的可读性。“显”是为了“以显其义”,而不是扩张其义;“隐”也不是削删其义,是隐中有显,显中有隐,手法不同,功用则一而已。

本研究借助自建翻译语料库,对翻译中的词类明晰化进行量化分析与探讨。用语料库来研究明晰化现象,具有直观明了的优势。借助数据,译者可对翻译策略做出调整。在数据与例证面前,作为译者,理应以傅雷要求的“敏感的心灵”,捕捉翻译中的灵感。

同时也要指出的:当前对明晰化研究有一种置疑,对翻译普遍性也存在不同的声音。我们试图避开这些争论,让事实说话,用丰富的语料来强化我们的翻译技能技巧。通过研究,我们也试图抛砖引玉:在翻译这种跨语际交往中,人类的认知思维为什么会存在明晰化现象?这现象符不符合语言的经济原则?这恐怕才是译者与评论家们认真思考的问题。

 

参考文献

Baker, M. 1993. “Corpus Linguistics and Translation Studies: Implications and Applications”. In Mona Baker, Gill Francis and Elena Tognini-Bonelli (eds.), Text and Technology: In Honour of John Sinclair. Amsterdam, Philadelphia: John Benjamins, 233-250.

Baker, M.1996. Corpus-based Translation Studies: The Challenges That Lie Ahead? In Harold Somers(ed.) Terminology, LSP and Translation. Amsterdam: John Benjamins, 175-186.

Baker, M. 1998. Réexplorer la langue de la traduction: une approche par corpus. Meta, 43(4): 480-485.

Baker, M. ‘Towards a methodology for investigating the style of a literary translator.’ Target(2000),  12(2): 241-266.

Blum-Kulka. S. Shifts of Cohesion and Coherence in Translation [J]. in Lawrence Venuti (ed.) The Translation Studies Reader[C].London and New York: Routledge.2000: 298-313.

Chen. W. A corpus-Based Approach to Modeling Explictitation in English-Chinese Translation[A]. FIT 2008.

Kenny, D. (2001), Lexis and Creativity in Translation. A Corpus-based Study. Manchester: St. Jerome Publishing.

Klaudy, K. Explicitation [A]. In M. Baker(ed.). Routledge Encyclopedia of Translation Studies[Z]. London and New York: Routledge. 1998.

Lederer. M. How the Explicit/Implicit Bifurcation of Meaning Impacts on Translation [J]. Chinese Translators Journal. 2005(3): 33-36.

Maeve Olohan. Introducing Corpora in Translation Studies[M]. London and New York: Routledge.2004:

McEnery, A. & Z. Xiao (2004). The Lancaster Corpus of Mandarin Chinese: A corpus for monolingual and contrastive language study[A]. In M. Lino, M. Xavier, F. Ferreire, R. Costa, R. Silva (eds.) Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC) 2004, pp. 1175-1178. Lisbon, May 24-30, 2004.

Nida. E. A. & C. Taber. The Theory and Practice of Translation [M].Leiden: E.J.Brill, 1969:164-5.

Olohan, M. (2004), Introducing Corpora in Translation Studies. London and New York: Routledge.

 Øverås L. In search of the third code: an investigation of norms in literary translation [J]. Meta, XLIII, 4, 1998

Shih Chung-ling. Corpus-based Study of Differences in Explicitation Between Literature Translations for Children and for Adults[J]. Translation Journal. 2008 No.3.

Shuttleworth. M. & Cowie. M. Dictionary of Translation Studies[M]Shanghai Foreign Language Education Press1997:55.

Vanderauwera, R. Dutch Novels Translated into English: The Transformation of a “Minority” Literature [M]. Amsterdam: Rodopi. 1985.

Wang Kefei, Qin Hongwu. A Parallel Corpus-based Study of Translational Chinese[A]. Proceedings of the International Symposium on Using Corpora in Contrastive and Translation Studies(UCCTS), Hangzhou, September 25-27,2008.

Xiao.R, He Liangzhen, Yue Ming. In pursuit of the “third code”, Using the ZJU Corpus of Translational Chinese in Translation[A]. Proceedings of the International Symposium on Using Corpora in Contrastive and Translation Studies(UCCTS), Hangzhou, September 25-27,2008.

Xiao, Z. and Yue, M. 2008. Using corpora in Translation Studies: The state of the art. In P. Baker (ed.) Contemporary Approaches to Corpus Linguistics. London: Continuum.

戴光荣. 基于语料库的英汉词汇互译研究[J]. 厦门理工学院学报,2008(3).

冯庆华.红译艺坛——《红楼梦》翻译艺术研究[M]. 上海:上海外语教育出版社,2006.

贺显斌. 英汉翻译过程中的明晰化现象 [J]. 解放军外国语学院学报, 2003 (4)

胡显耀. 用语料库研究翻译普遍性[J]. 解放军外国语学院学报,2005 (3): 45-48.

胡显耀. 当代汉语翻译小说规范的语料库研究[D]. 2006,东师大博士论文.

柯飞,翻译中的隐和显[J]. 外语教学与研究,2005(4): 303-307.

黄立波 王克非 翻译普遍性研究反思[J].中国翻译, 20065

黄立波. 基于汉英/英汉平行语料库的翻译共性研究[M].上海:复旦大学出版社,2007

刘泽权 侯羽. 国内外显化研究现状概述[J]. 中国翻译,2008(5).

乔海清. 论显译[J]. 上海科技翻译, 1999 (3): 45-48.

王克非. 英汉/汉英语句对应的语料库考察[J]. 外语教学与研究,2003(6): 410-416.

王克非 双语对应语料库研制与应用[M], 北京:外语教学与研究出版社,2004.

吴昂 黄立波. 关于翻译共性的研究[J]. 外语教学与研究,20065.

祖保泉. 文心雕龙解说[C]. 合肥:安徽教育出版社,1993793.

【注】文中的图一、二、三、四、五、十,请见附图:

 











https://wap.sciencenet.cn/blog-331736-394492.html

上一篇:与韩素音翻译大奖失之交臂的译文
下一篇:第二届“基于语料库的语言对比与翻译研究”国际学术研讨会综述
收藏 IP: .*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 04:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部