Ouariel的个人博客分享 http://blog.sciencenet.cn/u/Ouariel

博文

基于双向多视角关系图卷积网络的论辩对抽取方法

已有 446 次阅读 2025-7-21 14:39 |系统分类:博客资讯

引用本文

 

张虎, 吴增泰, 王宇杰. 基于双向多视角关系图卷积网络的论辩对抽取方法. 自动化学报, 2025, 51(6): 12901304 doi: 10.16383/j.aas.c240541

Zhang Hu, Wu Zeng-Tai, Wang Yu-Jie. Argument pair extraction method based on bidirectional multi-perspective relational graph convolutional network. Acta Automatica Sinica, 2025, 51(6): 12901304 doi: 10.16383/j.aas.c240541

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c240541

 

关键词

 

论辩对抽取,图卷积网络,论辩挖掘,多视角关系图 

 

摘要

 

论辩对抽取是论辩挖掘领域中的一项重要研究任务, 旨在从对话文档的两个段落中抽取互动论辩对. 现有研究通常将其分为序列标记和关系分类两个子任务, 通过预测段落间的句子级关系来抽取论辩对. 然而, 这些研究在整体论点级语义及句子内部细粒度语义逻辑信息的显式建模上仍存在不足, 且未充分考虑两个段落间复杂的上下文感知交互关系. 基于此, 提出一种双向多视角关系图卷积网络. 首先, 从段落内、依存语法和段落间视角分别构建论点关系图, 利用图结构表示文本的逻辑结构和语义交互关系, 为模型提供丰富的上下文语义信息. 然后, 通过引入多视角关系图卷积和图匹配模块, 在两个段落之间进行双向交互, 充分利用不同层次的论点间互动关系, 增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 实验结果表明, 相较于基线模型, 该方法在性能上有了显著提升.

 

文章导读

 

论辩挖掘在法律文档分析、学生写作指导和情感分析等各个领域都有重要的应用, 近年来已成为自然语言处理领域的研究热点. 作为论辩挖掘的重要组成部分, 对话论辩分析越来越受到研究关注, 其中论辩对抽取(Argument pair extraction, APE)是对话论辩领域中一项新的且具有挑战性的任务, 该任务由Cheng[1]提出, 其目的是从对话文档的两个段落中挖掘论辩对1展示了论辩对抽取的示例, 该示例包括讨论同一主题的两个争论段落, 每个段落都由若干句子构成, 这些句子可以分为论点和非论点. 论辩对抽取的目的就是从两个争论段落中抽取出可以形成论辩对的两个论点, 其中每个论点包含一个或多个句子.

 1  数据样例

 

论辩对抽取是一项极具挑战性的任务. 该任务由两个阶段构成: 第一阶段通过论点挖掘(Argument mining, AM)来识别所有论点句; 第二阶段将识别的论点句通过APE查询来两两配对, 最终抽取出具有互动关系的论辩对. 该任务不仅需要识别出论辩双方提出的论证结构, 还需要进一步识别出论辩参与者所提出的论点之间的互动关系. 论点之间的互动关系可能很复杂, 例如图1中论点诉称Arg-1”包含一个句子, 而与其配对的论点辩称Arg-1”则包含两个句子, 这种一对多或者多对多的情况普遍存在于APE任务中. 早期的研究将该任务分解为两个句子级子任务, 即序列标记任务和句子关系分类任务. 首先通过句子级序列标记来分别从两个不同段落中识别论点, 并通过句子关系分类来确定两个论点是否可以构成同一论辩对. 然后, 结合两个子任务的结果, 通过某些规则(比如笛卡尔积[2])间接推断论辩对. 然而, 这种管道式方法忽视了子任务之间的联系, 并且缺乏整体论点级交互关系的显式建模. 一些研究将这两个子任务在多任务学习框架内联合优化[2−5], 但是多任务框架的子任务协调能力较弱, 两个子任务仅通过共享特征编码器相互协调, 即用于单词标记序列的句子编码器和用于句子连接的段落编码器. 因此, 两个子任务之间的共享信息只是隐式学习. 此外, 有些研究通过将段落内和段落间的句子关系融合在同一个图中, 从而更好地建模不同层次的句子级关系[6−9]. 然而, 在同一个图结构内建模不同层次的句子关系可能会限制模型的学习能力, 因为不同层次的语义信息可能会相互干扰, 导致模型难以准确捕捉复杂的语义关系. 同时, 上述基于图的方法对句子词语间逻辑信息的建模也存在不足.

 

总而言之, 上述方法在整体论点级语义及句子词语间细粒度语义逻辑信息的显式建模上存在不足, 且未充分探索两个段落间复杂的上下文感知交互关系. 为解决上述问题, 本文提出一种基于双向多视角关系图卷积网络(Bidirectional multi-perspective relation graph convolutional network, BMRGCN)的论辩对抽取方法. 首先, 从段落内、句子词语间的依存语法、段落间视角来分别构建论点关系图, 利用图结构表示文本的逻辑结构和语义信息. 其中段落内图可以对段落内的论点跨度进行建模, 有助于整体论点级语义交互; 依存语法图可以帮助理解论点中的细粒度语义逻辑信息; 段落间图可以对段落间的交互关系进行建模, 帮助识别论辩对. 然后, 从两个方向($ D_a $$ D_b $, $ D_b $$ D_a $)通过多视角关系图卷积(Multi-perspective relational graph convolution, MRGC)模块和图匹配(Graph matching, GM)模块从句子级、词语级、段落级对论点整体进行建模, 充分利用不同层次的论点间互动关系, 从而增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 最后分别对$ D_a $$ D_b $中论点的开始位置、结束位置以及对预测到的论点是否能形成论辩对进行预测. 本文将论点挖掘和论辩对匹配两个子任务在同一个框架内学习训练, 有利于不同子任务之间的信息交互, 同时缓解累积错误.

 

本文的贡献如下:

1)从段落内、句子词语之间的依存语法、段落间三个方面分别构建了论点关系图.

2)提出BMRGCN, 从两个方向($ D_a $$ D_b $, $ D_b $$ D_a $)通过MRGCGM从句子级、词语级、段落级对论点整体建模, 并在同一框架内交叉更新APE的两个子任务, 在促进子任务间的信息交换的同时避免了错误累积.

3)在三个APE基准数据集上进行实验, 验证了本文模型的有效性.

 2  BMRGCN模型结构

 3  $ G^{Intra}$构建样例

 

本文提出了双向多视角关系图卷积网络模型来完成论辩对抽取任务. 首先, 从段落内、依存语法和段落间视角来构建论点关系图. 然后, 通过多视角关系图卷积模块和图匹配模块从两个方向细粒度地融合不同层次的语义信息, 增强模型对跨段落论点间语义联系的捕捉能力和论点关系的识别精度. 此外, 本文将论点挖掘和论辩对匹配两个子任务在同一个框架内交叉更新, 通过两个子任务之间的相互强化, 在促进不同子任务之间信息交换的同时避免错误累积. 在三个基准数据集上的实验结果表明, 本文的方法相较于基线模型而言取得了良好的性能.

 

作者简介

 

张虎

山西大学计算机与信息技术学院教授. 2014年获得山西大学计算机与信息技术学院工学博士学位. 主要研究方向为人工智能与自然语言处理. 本文通信作者. E-mail: zhanghu@sxu.edu.cn

 

吴增泰

山西大学计算机与信息技术学院硕士研究生. 主要研究方向为自然语言处理. E-mail: ZengtaiWu1116@163.com

 

王宇杰

山西大学计算机与信息技术学院博士研究生. 主要研究方向为自然语言处理. E-mail: init_wang@foxmail.com



https://wap.sciencenet.cn/blog-3291369-1494578.html

上一篇:梯度引导的JPEG压缩图像超分辨率重建
下一篇:基于深度强化学习的无人机自主感知−规划−控制策略
收藏 IP: 222.131.247.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-7-25 11:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部