章成志
自然语言处理领域的算法演化
2020-11-9 00:17
阅读:1900

       在数据驱动型研究论文中,大量算法正被提出、改进或使用。从论文全文内容中识别出算法并进行学术影响力评价,可以确定该领域流行的、经典的乃至新兴的算法,帮助初学者对特定领域算法有较为全面的了解。为此,我们以自然语言处理(NLP)领域为例,对1979~2015年间NLP领域顶级会议ACL全文内容中提及的算法实体进行标注,并构建算法词典;基于算法被提及频次和每年发表文章数,获取不同算法实体的年度学术影响力,进而得到算法实体在NLP领域的总影响力。我们还根据算法所在论文发表时间,分析算法学术影响力随时间演变的不同模式,并指出算法影响力演化反映了该领域研究任务和课题的变化。从演化图(https://chengzhizhang.github.io/research/algorithm_entity/algorithm_influence.html,在线mp4视频:https://chengzhizhang.github.io/research/algorithm_entity/video.html )可以明显看出,在NLP领域,1995年是个重要的时间节点,即机器学习方法逐渐成为主流;SVM从2005年开始独领风骚近十年,直到2015年;2015年开始,以神经网络为基础的深度学习算法成为主流。这项研究目前发表于Journal of Informetrics。


参考文献:

Yuzhuo Wang, Chengzhi Zhang*. Using the Full-text Content of Academic Articles to Identify and Evaluate Algorithm Entities in the Domain of Natural Language Processing. Journal of Informetrics, 2020, 14(2): 101091.[doi] [Demo: Algorithm Influence in NLP (1979~2015)] [Video]

转载本文请联系原作者获取授权,同时请注明本文来自章成志科学网博客。

链接地址:https://wap.sciencenet.cn/blog-36782-1257596.html?mobile=1

收藏

分享到:

当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?