黄龙旺
[转载]使用图神经网络提高说话人验证后端性能
2025-5-9 15:49
阅读:246

使用图神经网络提高说话人验证后端性能

陈金凤1, 2,方志华1, 2,何亮1, 2,3,4

(1. 新疆大学 计算机科学与技术学院,乌鲁木齐 8300172. 新疆信号检测与处理重点实验室,乌鲁木齐 8300173. 新疆大学 智能科学与技术学院学院,乌鲁木齐8300174. 清华大学 电子工程系;北京国家信息科学与技术研究中心,北京 100084 

摘要:目前关于说话人验证任务的研究集中在改进深度说话人模型,以提取高质量的说话人嵌入。然而,不同的说话人嵌入之间可以看做潜在的图结构。因此本文提出一种基于图神经网络的说话人验证后端方法,将说话人前端提取的说话人嵌入作为图结构利用图神经网络发掘嵌入之间的相互关系,得到更高质量的说话人嵌入。此外我们提出一种分组更新方法解决了当节点数量过多导致计算设备过载的问题。我们在VoxCeleb数据集上进行了大量的实验和消融,实验结果证明了我们提出的图神经网络说话人后端可以有效提升说话人验证系统的性能。

关键词:说话人验证,图神经网络,说话人嵌入

点击分享码全文pdf浏览:https://rdcu.be/ecxPP

Cite this articleChen, J., Fang, Z. & He, L. Improving Speaker Verification Back-End with Graph Neural Networks. J. Shanghai Jiaotong Univ. (Sci.) (2025). https://doi.org/10.1007/s12204-025-2806-8      

 12204_OF_25_012_GraphAbstract.jpg

转载本文请联系原作者获取授权,同时请注明本文来自黄龙旺科学网博客。

链接地址:https://wap.sciencenet.cn/blog-45888-1485089.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?