||
最近很忙,忙得睡不好,心发慌,好朋友说你为啥总折腾办会,为什么不安静下来多写点本子申请经费,或者多写几篇论文,多点硬通货。
是啊,办会很熬心,不只是耗费时间,还搭进去不少经费,可有些事情必须得有人去做。我经常想打退堂鼓,在做与不做之间犹豫,怀疑自己是不是在浪费生命。
但是,这的确是我想做的事情。因为语言学的很多问题,理论上争了很多年,能不能用计算建模的方法、大模型方法来验证?能不能像自然科学一样建立实验测试集,能够测试理论和技术的优劣。
一个语法体系好不好,过去只能依靠专家来论证,现在我们可以借助计算机,观察其对语言现象的覆盖率,机器自动标注的正确率。
就像今年新增的评测任务——叙实性问题:
我知道他恨我(他恨我) VS 我以为他恨我(他并不恨我)
动词的意义差不多,到底是动词导致的结果不同,还是语境导致的?现在可以用计算机来建模测试!
汉语的句子语义表示方法有多种,能否精确地描述空间语义,框架语义学还是依存语法更管用,都可以“算一算”!
古诗词的内容,作文的修辞手法,文学语言能不能让机器来分析和理解?
汉字手写的好不好,能不能让机器来辅助纠正?
中医能不能用AI来赋能自动诊断和处方?
这些问题,传统的语言学关心的不多,却是今天语言智能产业的基础问题和应用问题。看到这么多的好问题都进入了计算和人工智能的研究范畴,内心是澎湃的。这也是我和李正华老师在前年耗费了很大的气力,让大家把参赛情况写成论文,发布到ACL Anthony的源动力。让我们在汉语做的这些新鲜尝试,让世界都能了解,都来参与。
今天,我知道自己未必在做“正确”的事,但是自己内心想做的事。
CCL-Eval2025
http://cips-cl.org/static/CCL2025/cclEval/taskEvaluation/index.html (报名链接)
任务1:第五届空间语义理解评测(SpaCE 2025)
任务2:第三届汉语框架语义解析评测
任务3:第五届中文抽象语义表示解析评测(CAMRP 2025)
任务4:第一届中文叙实性推理评测(FIE2025)
任务5:第一届中文古诗词赏析评测
任务6:第二届中文作文修辞识别评测
任务7:第一届中国文学语言理解评测(争鸣)
任务8:中文电子病历ICD诊断编码评测
任务9:中医辨证辨病及中药处方生成评测
任务10:细粒度中文仇恨言论识别评测
任务11:大学生汉字硬笔书写质量评测
任务12:第一届面向中文语音的实体关系三元组抽取评测
CCL-Eval2024
任务1:第二届汉语框架语义解析评测
任务2:中文意合图语义解析评测
任务3:第四届中文空间语义理解评测(SpaCE 2024)
任务4:第四届中文抽象语义表示解析评测(CAMRP 2024)
任务5:古文历史事件类型抽取评测
任务6:中小学作文修辞识别与理解评测
任务7:第二届中小学作文流畅性评价
任务8:儿童故事常识推理与寓意理解评测
任务9:中文图文多模态理解评测
任务10:手语数字人翻译质量评测
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-5-1 10:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社