Atlantis Press China分享 http://blog.sciencenet.cn/u/atlantispress 数字出版平台,开放获取先锋

博文

文章荐读 NLPR | 开放域神经对话生成方法综述

已有 1954 次阅读 2021-4-21 18:01 |个人分类:文章荐读|系统分类:论文交流

小编导读

开放域对话生成(Open-Domain Dialogue Generation)是自然语言处理领域的一个重要问题。随着深度学习技术的发展,目前已经出现了多种神经对话生成方法。来自北京理工大学计算机学院的李侃教授和孙斌博士在期刊Natural Language Processing Research(eISSN 2666-0512)上发表了题为“Neural Dialogue Generation Methods in Open Domain: A Survey”的文章,对开放域神经对话生成方法进行了综述。

要点介绍 

对话系统的研究可以追溯到1950年的图灵测试。如果一台机器能与人类对话并且不会暴露它的机器身份,那么这台机器就被称为智能机器。也就是说,自动对话系统的发展可以在一定程度上反映人工智能的发展程度。因此,对话系统在人工智能领域具有极其重要的研究价值。对话系统的最终目的是模拟人类对话过程,产生类人的反应。在过去的几十年里,对话系统在人工智能领域引起了广泛的关注

根据功能定位,一般将对话系统分为两类:任务型对话系统和非任务型对话系统。面向任务的对话系统又称闭域对话系统或目标驱动对话系统,即系统具有明确的服务目标或服务对象,如查询餐厅、查询公交线路、查询天气、订票、订餐等。在我们的日常生活中,DuMi、JIMISiri都是面向任务的对话系统。面向非任务的对话系统也称为开放域对话系统。它主要是基于日常聊天,而不是回答用户提出的具体任务。例如,微软的小冰就是目前最著名的开放域对话系统。本文主要研究开放域对话系统。

在本综述中,我们详细阐述了现有生成方法的研究历史,并将其大致分为六大类,即基于编译码框架的方法基于分层递归编译码器(HRED的方法、基于变分自动编码器(VAE的方法、基于强化学习(RL的方法,基于生成对抗网络(GAN的方法和基于预训练模型的方法。我们深入到每一类的方法中,并对这些方法进行了详细的讨论。在此基础上,对各种方法进行了比较,分析了各自的优缺点。我们列举了一些开放存取的公共数据集和一些常用的自动评估指标。最后,我们讨论了一些可能的研究方向,以期将神经对话生成的研究推向一个新的前沿。

微信图片_20210421174124.png

图1. 编码器-解码器框架的示意图(来源:Chen et al. [10])

微信图片_202104211741241.png

图2. 分层递归编码器-解码器(HRED)结构的示意图(来源:Serban et al. [29])

研究结论:本文以开放领域对话系统为研究对象,回顾了主要的生成性对话方法。生成性对话方法不受对话资源库的限制,直接根据上下文语义和用户消息生成响应。然而,作为自然语言处理领域的一个重要研究方向,还有许多问题需要进一步探讨。目前这一代的会话技术还不成熟,会导致系统反应迟钝或过于笼统。自动评估指标和人为评分之间的关系还不太清楚。最后,针对开放领域的神经对话生成任务,我们提出了一些可行的研究方向。

参考文献 References

[1]  A.M. Turing, Computing machinery and intelligence, Mind. 49 (1950), 433–460.

[2]  T. Fong, C.E. Thorpe, C. Baur, Collaboration, dialogue, human- robot interaction, in: R.A. Jarvis, A. Zelinsky (Eds.), ISRR, Springer Tracts in Advanced Robotics, vol. 6, Springer, Berlin, Heidelberg, Germany, 2001, pp. 255–266.

[3]  J. Weizenbaum, ELIZA - a computer program for the study of natural language communication between man and machine, Commun. ACM. 9 (1966), 36–45.

[4]  K.M. Colby, F.D. Hilf, S. Weber, H.C. Kraemer, Turing-like indis- tinguishability tests for the calidation of a computer simulation of paranoid processes, Artif. Intell. 3 (1972), 199–221.

[5]  D. Ameixa, L. Coheur, P. Fialho, P. Quaresma, Luke, I am your father: dealing with out-of-domain re-quests by using movies sub- titles, in: T. Bickmore, S. Marsella, C. Sidner (Eds.), Intelligent Vir- tual Agents, IVA, Lecture Notes in Computer Science, vol. 8637, Springer, Cham, Switzerland, 2014, pp. 13–21.

[6]  W.H. Gomaa, A.A. Fahmy, A survey of text similarity approaches, IJCA. 68 (2014), 13–18.

[7]  X. Zhou, L. Li, D. Dong, Y. Liu, Y. Chen, W.X. Zhao, et al., Multi- turn response selection for chatbots with deep attention matching network, in Proceedings of the 56th Annual Meeting of the Asso- ciation for Computational Linguistics (Volume 1: Long Papers), Melbourne, Australia, 2018, pp. 1118–1127.

[8]  I. Sutskever, O. Vinyals, Q.V. Le, Sequence to sequence learn- ing with neural networks, in Twenty-eighth Conference on Neu- ral Information Processing Systems (NeurIPS-2014), Palais des Congrès de Montréal, Montréal CANADA, 2014, pp. 3104–3112. https://proceedings.neurips.cc/paper/2014/hash/a14ac55a4f2747 2c5d894ec1c3c743d2-Abstract.html

[9]  L. Shang, Z. Lu, H. Li, Neural responding machine for short-text conversation, in Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th Interna- tional Joint Conference on Natural Language Processing (Volume 1: Long Papers), Beijing, China, 2015, pp.1577–1586.

[10]  H. Chen, X. Liu, D. Yin, J. Tang, A survey on dialogue systems: recent advances and new frontiers, SIGKDD Explor. 19 (2017), 25–35.

[11]  J. Li, M. Galley, C. Brockett, G.P. Spithourakis, J. Gao, W.B. Dolan, A persona-based neural conversation model, in Proceed- ings of the 54th Annual Meeting of the Association for Compu- tational Linguistics (Volume 1: Long Papers), Berlin, Germany, 2016.

 

原文信息

微信图片_20210421175223.png

扫描二维码,获取英文原文

B. SunK. Li "Neural Dialogue Generation Methods in Open Domain: A Survey", Natural language processing Research, 2021, DOI: 10.2991/nlpr.d.210223.001.


关于作者

李侃老师.png

李侃,博士,教授,博士生导师。国家863评审专家,博士点基金/博士后基金评审专家,CCF互联网专委会委员,计算机应用专委会委员,YOCSEF委员,北京市青少年后备人才导师。目前主要从事机器学习、数据挖掘、及分布式系统方面的研究。承担了国家973课题、863重大、国家自然科学基金、教育部博士点基金、国防重点型号、预先研究项目、技术基础等多项国家级和部级项目,获得了国防科技进步奖等科研奖励。在国内外期刊、学术会议上发表SCI/EI检索论文50余篇,发明专利近20项,出版了教育部精品教材和北京市精品教材等。获得了第七届青年教师基本功大赛一等奖,T-more优秀教师奖,第十三届教学成果奖等教学奖励。


关于期刊

cover.jpg

自然语言处理研究(Naturnal Language Processing Research, eISSN 2666-0512)是一本国际化的,经过严格同行评审的开放获取期刊,涵盖有关计算语言学和自然语言处理的所有领域。

本刊由北京理工大学李侃教授担任主编,中科院自动化所宗成庆研究员和美国华盛顿大学Emily M. Bender担任顾问委员。

该期刊为原创性高质量的自然语言处理领域的学术研究提供了一个开放平台,旨在加深我们对这些领域基本问题的理解。NLPR上的文章通常比会议论文长,尤其关注研究方法或其理论意义。因此,本刊特别欢迎那些在其方法设置和/或理论基础方面很强的研究。除了所有文章的常规质量标准(如实质性内容、原创新和贡献意义),扎实的评价和高质量的分析是实验论文的最低要求。更多期刊主题详见:https://www.atlantis-press.com/journals/nlpr/aims-and-scope

NLPR采用开放获取的出版形式,由作者保留版权。所有文章经过同行评审接收后,不收取任何费用。现已开放Editorial Manager线上投稿平台:https://www.editorialmanager.com/nlpr/default.aspx。欢迎广大学者赐稿!


版权声明:
*本文内容由Atlantis Press中国办公室编辑。欢迎转发。如需转载,请在留言区留言,或联系xin.guo@atlantis-press.com。


AP Logo.jpg

Atlantis Press是科学、技术和医学(STM)领域的全球开放获取出版品牌,2006年创立于法国巴黎,在巴黎、阿姆斯特丹、北京、郑州和香港设有办事处。我们的使命是通过促进科研界和整个社会更有效地传播和交流知识来支持科学、技术和医学研究的进步。迄今,Atlantis Press的数字内容平台包含超过14万篇开放获取论文供读者免费下载阅读,每年产生2500多万下载量。Atlantis Press施普林格·自然的一部分。




https://wap.sciencenet.cn/blog-3453320-1283099.html

上一篇:文章荐读 | 基于深度核学习的贝叶斯深度强化学习
下一篇:文章荐读 JRNAL | 一种基于虚拟现实技术的遥操作移动机器人路径规划方法

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-1-26 05:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部