科学网-[转载]使用图神经网络提高说话人验证后端性能-黄龙旺的博文

[转载]使用图神经网络提高说话人验证后端性能

2025-5-9 15:49

阅读：2011

使用图神经网络提高说话人验证后端性能

陈金凤^{1, 2}，方志华^{1, 2}，何亮^{1, 2,3,4}

（1. 新疆大学计算机科学与技术学院，乌鲁木齐 830017；2. 新疆信号检测与处理重点实验室，乌鲁木齐 830017；3. 新疆大学智能科学与技术学院学院，乌鲁木齐830017；4. 清华大学电子工程系；北京国家信息科学与技术研究中心，北京 100084）

摘要：目前关于说话人验证任务的研究集中在改进深度说话人模型，以提取高质量的说话人嵌入。然而，不同的说话人嵌入之间可以看做潜在的图结构。因此本文提出一种基于图神经网络的说话人验证后端方法，将说话人前端提取的说话人嵌入作为图结构利用图神经网络发掘嵌入之间的相互关系，得到更高质量的说话人嵌入。此外我们提出一种分组更新方法解决了当节点数量过多导致计算设备过载的问题。我们在VoxCeleb数据集上进行了大量的实验和消融，实验结果证明了我们提出的图神经网络说话人后端可以有效提升说话人验证系统的性能。

关键词：说话人验证，图神经网络，说话人嵌入

点击分享码全文pdf浏览：https://rdcu.be/ecxPP

Cite this article：Chen, J., Fang, Z. & He, L. Improving Speaker Verification Back-End with Graph Neural Networks. J. Shanghai Jiaotong Univ. (Sci.) (2025). https://doi.org/10.1007/s12204-025-2806-8

转载本文请联系原作者获取授权，同时请注明本文来自黄龙旺科学网博客。

链接地址：https://wap.sciencenet.cn/blog-45888-1485089.html?mobile=1

当前推荐数：0

推荐到博客首页

网友评论0 条评论

该博文允许注册用户评论请点击登录