张鹰的博客分享 http://blog.sciencenet.cn/u/yingzhang1 农村小伙的回顾与展望

博文

2.14 语言中的一些有趣的科学与文化现象

已有 29764 次阅读 2021-4-8 14:36 |个人分类:科技2|系统分类:观点评述


语言是人赖以生存的工具,时时刻刻运用在生活的方方面面,甚至在你阅读这一段文字的时候,我们也在通过语言进行交流与沟通。因为语言的无处不在,与生活的紧密联系,有时候反而难以解释,就好像如何理解小孩子本能地习得语言,或者让中国人解释何为中国文化一般,都是极为困难的。这种情况下,我们往往依赖比较这个工具,通过比较不同语言,比较在不同领域的应用,比较随着时间的变化,来更多感受语言的有趣与重要。

《科学》杂志的社论中说,语言——精美绝妙的结构,复杂而又多种多样——是人类独有的才能,是人被称为人的一个核心。[1] 司马贺在一篇关于未来的论文中提到,他认为语言、组织(organizing)的能力与计算机,是人类最重要的三项发明[2]。这些来自于不同学者的论断都向我们展示了语言的重要性。

语言作为交流的工具,很类似于电子通讯的步骤,编码-传输-解码:首先将信息转化成信号,然后信号通过媒介传输,最后将获得的信号解码成为信息,便完成了交流的过程。比如,“你好”一词先转化为计算机可传输的二进制数字,然后计算机传输,最后二进制数字再转化为“你好”。语言中,意义编码转化为信号的过程是比较有意思的。波罗迪茨基解释道,语言学中的信号(signal,比如视觉上的文字,听觉的发音)与这个信号所携带的意义很大程度上是随意的, 一个语言信号的意义与人感受到的物理性质中并没有太多相关性,反而,这种对应关系主要是惯例,比如单词蓝的发音很可能与人感受到的光学性质无关,与蓝的书写形式也无关,这个蓝字在不同的语言中有不同的发音,而在哑语中则没有发音[1]

发音与语义之间的相关性,也是语言学中一个有趣研究方向,尤其是当这类词的发音与语义之间的相关性超过随机概率时。有研究发现,在南岛民族(Austronesian)的发音中,使用鼻音gn(或ng,音标ŋ)的单词语义上与嘴或牙齿有较大的相关性[3]。英语中,动词gnaw(啃咬), gnash(咬牙切齿)也展示了这种相关性,或许是因为gn的发音比较经常用到了嘴部肌肉和牙齿的动作。笔者所使用的方言沙地话(崇启海方言)有使用的gn鼻音,也展示了类似的发音-语义相关性,咬(gnao),啃(gna),牙(gna),硬(gnang)。当然作为例证或许还要方言学家建立更全的语料库,把其他鼻音的词,眼(gnae),癌(gnie,鱼(gnei),呆(gnai)等似乎与牙齿无关的词语进行统计上的分析与区别。建立的语料库也可以分析一些不同地区的共有特征,比如获得搞笑诺贝尔奖(Ig Nobel Prize)的关于“Huh?”类似发音在很多不同地区都展示了相同的含义,用来表达未听清而询问的意思 [4],这些有趣的发音现象有待进一步的研究与发现。

在语言中,书面文字的形式相对于口语展示了不同的特征。科幻小说家姜特德在他的短篇小说《双面真相》中给出了一些关于英语语言的观察与思考:在说话时,人们并没有一个很明显的音节之间的停顿,但是在书面文字中却有单词的分隔,这种差异很大程度上由顺序性的(sequential,时序的)不同而造成的[5]。我们知道、口语是顺序性的,后一个词一定出现在前一个词之后(这不废话吗?你来试试先说后面的词);但在书面阅读时人们并不强烈依赖于顺序性,比如看到“游泳的我是兴趣”时,读者也能明白“我的兴趣是游泳”。由于眼睛可以一目多词,英语单词间的空格就能很有效地分隔,加速理解。比如“My hobby is swimming”就比更加类似口语表达的(没有音节停顿)的文字Myhobbyisswimming”更快传达讯息。

谈到书写文字,汉字也是一个非常独特的存在。汉字作为当代唯一仍然被广泛采用的表语文字(logogram,语素文字),与之对应的是绝大多数的表音文字(phonogram)。顾名思义,英语、西班牙语等表音文字,是用书写的方式来代表发音,表音文字一般也不具有内在的含义。而表语文字的汉字却可以含有内在含义,尤其是象形造字法中的日、月、山、水作为描绘日月山水的图案,为人们所熟知。当我阅读日语汉字教材时,Basic Kanji Book 给出的一些汉字来源的解释[6],也让我惊叹汉字真是一个伟大的发明。日语中采用汉字,似乎也在一定程度上提高阅读的效率。比如“私の趣味は水泳です”,比起完全日文假名的“わたししゅみはすいえいです”,在阅读训练与学习的过程中,更容易把有意义的词语分隔合并形成意群,而且减少了对于读音的顺序依赖,而增加信息交流的速度,利用“一目十行”的优势。当然随着汉字的发展,产生了新的构词方式,更多的汉字采取联想、抽象的方式,而形声字的数量远超过了象形字。英语等表音文字,也依赖于词根词缀等语素进行词汇的扩张。第一次阅读《英语词汇的奥秘》[7],这本书中给出的一些词根、单词的相关性与联想的例子与规律,也让我觉得非常有趣,背单词时也更加高效。在我们建立方言等语料库的时候进行研究时,或许依然需要借助音标或创造表音文字,用文字(script)的方式来标记语料库,用来数据化地分析语言。

对于计算机而言,编码规则与传输方式确定了,似乎信息交流的任务就解决了。但是人不是机器,我们无法呆板地执行规则。我们需要学习语言,需要学习编码--意义这一种关系,这便涉及到了神经科学。语言学是神经科学中一个非常重要与困难的领域,语言的发展与脑科学、神经系统的发展也是休戚相关[1]。“相比在孩童时期有语言接触(language exposure)的普通人来说,若一个人的孩童时期没有办法接触语言,那么他的神经连接会展现截然不同的特征,认知层面上也有巨大的差异;在环境中接触语言的时机越晚,那么这种差异越大;从这个角度来看,神经科学的研究对象,普通人的大脑,其实是一个已经‘语言化’的大脑。……,理解人类的大脑离不开对语言的理解”[1]。从视觉获得的认知与大脑的关系可以用用动物实验,但是语言获得的认知难以通过动物实验进行研究,因为动物不说人话。当然一些动物也能理解人类的语言,比如狗能听懂坐、停、吃饭等简单词语,是比较单向的语言学习,的确有一些神经科学与语言的研究去试着理解动物这种对人类口语的学习,但是大多数的还是对人类的研究。[8] 在自然语言处理(natural language processing, 用统计的方法处理语言语音或文本),当考虑词语的前后关系时,对于这种共同出现词语的频率的考量,语音识别的正确率得到大幅提高(N-gram模型远远好于Unigram模型)[9]。这样一种词语之间联系、联想与组织的能力也是神经科学研究的重要方向[1011]语言是人类智慧,人类理解能力的一部分。比如在科学中,电阻这个词,其实已经表示这个量与电流有一定负相关的关系,或者黏滞系数其实已经表示了阻碍物体的运动。

语言伴随着人类一直在演化与变迁。人理解的的金木水火土的含义,和现代人理解的金木水火土并不一样就好像金木水火土对于一个小孩子的意义,和受过教育的成年人的意义也并不相同,这是语言随着时间的改变的例子。而网络上,曾经有一个好玩的问题,请问眼镜蛇在眼镜发明之前它的名字是什么?因为眼镜蛇并不是中国的物种,所以它同名字一起被引入到我们的文化之中,这是语言随着地区的演化。语言学与神经科学,大数据处理等等产生了更多的交叉,有很多有趣的问题值得我们进一步探索和追寻。

引用文献:

[1] 莱拉·波罗迪茨基,语言与大脑,科学,366卷,13页,2019年。Boroditsky, Lera. "Language and the brain." Science, vol 366, (2019): p13.

[2]司马贺,预测未来还是塑造未来?工业与公司变化,11卷,601页,2002年。 Simon, H. A. Forecasting the future or shaping it?. Industrial and Corporate Change (2002), vol 11, p.601.

 

[3] 罗伯特·布拉斯特,南岛民族语言中的联觉音组ŋ,洋流性语言学, 187页,2003年。Blust, Robert. "The phonestheme ŋ in Austronesian languages." Oceanic linguistics (2003): p.187.

[4]马克·丁格曼斯,弗朗西斯科·托雷拉,尼克·恩菲尔德,“哈?”是一个通用词吗?话语的基础结构和语言学条目演化的汇聚,Plos 1, 8卷,e78273, 2013 Dingemanse, Mark, Francisco Torreira, and Nick J. Enfield. "Is Huh?a universal word? Conversational infrastructure and the convergent evolution of linguistic items." PloS one 8,  (2013): e78273.

[5] 特德·姜,呼吸,耿辉等译,译林出版社,2019年。

[6] 加納千恵子, 竹中弘子, 石井恵理子, 清水百合, 基本汉字500凡人社,第四版, Chieko Kano , Hiroko Takenaka , Eriko Ishii , Yuri Shimizu, Basic Kanji Book vol. 1, Bonjinsha, 4th edition, 1990.

[7] 蒋争,英语词汇的奥秘,中国国际广播出版社,2000年。

[8]埃里克·查韦斯,发音学习和口语语言的演化,科学,366卷,50页,2019年。 Jarvis, Erich D. "Evolution of vocal learning and spoken language." Science 366, (2019): p.50

[9]克里斯多夫·曼宁,亨里克·舒茨,统计自然语言处理的基础。麻省理工学院学院出版社,1999年,第六章。Manning, Christopher, and Hinrich Schutze. Foundations of statistical natural language processing. MIT press, 1999, Chapter 6.

[10] 皮特·哈郭特,超越单词处理的语言的神经生物学,科学,366卷,55页,2019年。Hagoort, Peter. "The neurobiology of language beyond single-word processing." Science vol. 366, (2019): p.55.

[11]派尔卡聂,组合句法与语义学的神经学基础,科学,366卷,62页,2019年。 Pylkkänen, L.,. The neural basis of combinatory syntax and semantics. Science, vol. 366 (2019), p.62.

 




https://wap.sciencenet.cn/blog-3116575-1280946.html

上一篇:2.13 医学与生命科学的发展三:大数据的应用与挑战
下一篇:2.16 无障碍社会:提高公众意识与科技投入
收藏 IP: 85.203.46.*| 热度|

9 李宏翰 张学文 张晓良 朱晓刚 杨正瓴 郑永军 赫荣乔 刘钢 李俊臻

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-19 17:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部