随园厚学分享 http://blog.sciencenet.cn/u/gothere 计算语言学博士 希望在这里留下学术的足迹

博文

让语言学的问题变成可计算的实证问题——写在CCL2025评测开启之际

已有 461 次阅读 2025-4-29 20:44 |个人分类:Computational Linguistics|系统分类:观点评述

最近很忙,忙得睡不好,心发慌,好朋友说你为啥总折腾办会,为什么不安静下来多写点本子申请经费,或者多写几篇论文,多点硬通货。

是啊,办会很熬心,不只是耗费时间,还搭进去不少经费,可有些事情必须得有人去做。我经常想打退堂鼓,在做与不做之间犹豫,怀疑自己是不是在浪费生命。

但是,这的确是我想做的事情。因为语言学的很多问题,理论上争了很多年,能不能用计算建模的方法、大模型方法来验证?能不能像自然科学一样建立实验测试集,能够测试理论和技术的优劣。

一个语法体系好不好,过去只能依靠专家来论证,现在我们可以借助计算机,观察其对语言现象的覆盖率,机器自动标注的正确率。

就像今年新增的评测任务——叙实性问题:

              我知道他恨我(他恨我)  VS  我以为他恨我(他并不恨我)

动词的意义差不多,到底是动词导致的结果不同,还是语境导致的?现在可以用计算机来建模测试!

汉语的句子语义表示方法有多种,能否精确地描述空间语义,框架语义学还是依存语法更管用,都可以“算一算”!

古诗词的内容,作文的修辞手法,文学语言能不能让机器来分析和理解?

汉字手写的好不好,能不能让机器来辅助纠正?

中医能不能用AI来赋能自动诊断和处方?

这些问题,传统的语言学关心的不多,却是今天语言智能产业的基础问题和应用问题。看到这么多的好问题都进入了计算和人工智能的研究范畴,内心是澎湃的。这也是我和李正华老师在前年耗费了很大的气力,让大家把参赛情况写成论文,发布到ACL Anthony的源动力。让我们在汉语做的这些新鲜尝试,让世界都能了解,都来参与。                          

今天,我知道自己未必在做“正确”的事,但是自己内心想做的事。

CCL-Eval2025

http://cips-cl.org/static/CCL2025/cclEval/taskEvaluation/index.html (报名链接)

任务1:第五届空间语义理解评测(SpaCE 2025)

任务2:第三届汉语框架语义解析评测

任务3:第五届中文抽象语义表示解析评测(CAMRP 2025)

任务4:第一届中文叙实性推理评测(FIE2025)

任务5:第一届中文古诗词赏析评测

任务6:第二届中文作文修辞识别评测

任务7:第一届中国文学语言理解评测(争鸣)

任务8:中文电子病历ICD诊断编码评测

任务9:中医辨证辨病及中药处方生成评测

任务10:细粒度中文仇恨言论识别评测

任务11:大学生汉字硬笔书写质量评测

任务12:第一届面向中文语音的实体关系三元组抽取评测

CCL-Eval2024

任务1:第二届汉语框架语义解析评测

任务2:中文意合图语义解析评测

任务3:第四届中文空间语义理解评测(SpaCE 2024)

任务4:第四届中文抽象语义表示解析评测(CAMRP 2024)

任务5:古文历史事件类型抽取评测

任务6:中小学作文修辞识别与理解评测

任务7:第二届中小学作文流畅性评价

任务8:儿童故事常识推理与寓意理解评测

任务9:中文图文多模态理解评测

任务10:手语数字人翻译质量评测



https://wap.sciencenet.cn/blog-39714-1483971.html


收藏 IP: 222.95.203.*| 热度|

1 xtn

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-1 10:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部