Atlantis Press China分享 http://blog.sciencenet.cn/u/atlantispress 数字出版平台,开放获取先锋

博文

文章荐读 NLPR | 从自然语言处理的角度谈虚假信息检测的动机、方法和测度

已有 4086 次阅读 2021-4-26 16:56 |个人分类:文章荐读|系统分类:论文交流

小编导读

随着互联网和社交媒体平台的普及,虚假信息的产生和传播呈爆炸式增长,并以不可控制的速度迅速传播。虚假信息的广泛传播影响着公众舆论,并威胁着社会/政治发展,其对民主、正义和公众信任的损害已经成为一个严重的全球性问题。在过去的十几年中,虚假信息检测(Misinformation detection)在增强公众信任和社会稳定方面发挥了关键作用。北京大学苏祺副教授团队和香港理工大学黄居仁教授团队在《Natural Language Processing Research》期刊(eISSN 2666-0512)发表了题为“Motivations, Methods and Metrics of Misinformation Detection: An NLP Perspective”的论文,从自然语言处理(NLP)的角度对虚假信息检测的最新研究进行了全面的回顾总结。


内容提要

虚假信息的产生往往跨越了不同的领域、语言、文化和时间,并且在传播过程中也在不断发展,具有公开性、复杂性、动态性和不确定性的特征。现有关于虚假信息的研究从分析性研究到预测模型可以概括为两个维度:

1)内部维度强调了与真实信息对比,表征了虚假信息内在属性的观察过程;

2)外部维度通过对各种信息建模,显示了预测虚假信息类型/程度的检测过程。

这两个维度定义并代表了虚假信息识别的两个主要研究方向,如下图所示:

微信图片_20210426164642.png

尽管已经从各种角度进行了数十年的努力,但虚假信息检测对于自然语言处理而言仍然是一项艰巨的任务。例如,现有的数据集通常限制在某个特定领域,主要针对政治新闻,并且在数据大小和预标记方面也显示出局限性,从而限制了虚假信息检测系统的准确性和可靠性。下表显示了用于虚假信息识别的标准数据集:

微信图片_20210426164642.jpg

有理由相信,未来可能会构建更加多样化的数据集,甚至包括多模式表征、多源数据和多方面推理的综合应用。

文章讨论了虚假信息及其检测的主要问题,并从检测方法、特征表示,评估指标和参考数据集等方面对当前具有代表性的研究工作进行了全面综述。另外,在重点研究了基于内容的分析和预测建模的基础上,文章对比了一些关键技术的优缺点,同时也提出了挑战和机遇,对未来的NLP研究具有启示意义。

 

原文信息

微信图片_202104261646421.png

Qi, Su, et al. "Motivations, Methods and Metrics of Misinformation Detection: An NLP Perspective." Natural Language Processing Research, 2020, https://doi.org/10.2991/nlpr.d.200522.001.

 

关于作者

苏祺,北京大学外国语学院外国语语言学及应用语言学研究所、北京大学信息科学技术学院计算语言学研究所双聘副教授,博士生导师。研究领域和方向:计算语言学、语料库语言学。

黄居仁,美国康奈尔大学语言学博士,香港理工大学中文及双语学系讲座教授、国际计算语言学委员会(ICCL)终身委员、北京大学计算语言学研究所客座教授、中国语言学研究中心兼职研究员、北大-理大汉语语言学研究中心主任。研究方向为词汇语义学、计算语言学、语料库语言学、知识本体等。

 

关于期刊

cover.jpg

自然语言处理研究(Naturnal Language Processing Research, eISSN 2666-0512)是一本国际化的,经过严格同行评审的开放获取期刊,涵盖有关计算语言学和自然语言处理的所有领域。

本刊由北京理工大学李侃教授担任主编,中科院自动化所宗成庆研究员和美国华盛顿大学Emily M. Bender担任顾问委员。

该期刊为原创性高质量的自然语言处理领域的学术研究提供了一个开放平台,旨在加深我们对这些领域基本问题的理解。NLPR上的文章通常比会议论文长,尤其关注研究方法或其理论意义。因此,本刊特别欢迎那些在其方法设置和/或理论基础方面很强的研究。除了所有文章的常规质量标准(如实质性内容、原创新和贡献意义),扎实的评价和高质量的分析是实验论文的最低要求。更多期刊主题详见:https://www.atlantis-press.com/journals/nlpr/aims-and-scope

NLPR采用开放获取的出版形式,由作者保留版权。所有文章经过同行评审接收后,不收取任何费用。现已开放Editorial Manager线上投稿平台:https://www.editorialmanager.com/nlpr/default.aspx。欢迎广大学者赐稿!

 

版权声明:

*本文内容由Atlantis Press中国办公室编辑。欢迎转发。如需转载,请在留言区留言,或联系xin.guo@atlantis-press.com


AP Logo.jpg

Atlantis Press是科学、技术和医学(STM)领域的全球开放获取出版品牌,2006年创立于法国巴黎,在巴黎、阿姆斯特丹、北京、郑州和香港设有办事处。我们的使命是通过促进科研界和整个社会更有效地传播和交流知识来支持科学、技术和医学研究的进步。迄今,Atlantis Press的数字内容平台包含超过14万篇开放获取论文供读者免费下载阅读,每年产生2500多万下载量。Atlantis Press施普林格·自然的一部分。



https://wap.sciencenet.cn/blog-3453320-1283866.html

上一篇:文章荐读 MATHI | 多流体电纺丝的发展及其生物应用
下一篇:文章荐读 IJCIS | 利用基于数据驱动的犹豫模糊算法分析网上购物行为
收藏 IP: 111.118.204.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 22:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部