Yetta分享 http://blog.sciencenet.cn/u/yetta

博文

[转载]使用图神经网络提高说话人验证后端性能

已有 149 次阅读 2025-5-9 15:49 |系统分类:论文交流|文章来源:转载

使用图神经网络提高说话人验证后端性能

陈金凤1, 2,方志华1, 2,何亮1, 2,3,4

(1. 新疆大学 计算机科学与技术学院,乌鲁木齐 8300172. 新疆信号检测与处理重点实验室,乌鲁木齐 8300173. 新疆大学 智能科学与技术学院学院,乌鲁木齐8300174. 清华大学 电子工程系;北京国家信息科学与技术研究中心,北京 100084 

摘要:目前关于说话人验证任务的研究集中在改进深度说话人模型,以提取高质量的说话人嵌入。然而,不同的说话人嵌入之间可以看做潜在的图结构。因此本文提出一种基于图神经网络的说话人验证后端方法,将说话人前端提取的说话人嵌入作为图结构利用图神经网络发掘嵌入之间的相互关系,得到更高质量的说话人嵌入。此外我们提出一种分组更新方法解决了当节点数量过多导致计算设备过载的问题。我们在VoxCeleb数据集上进行了大量的实验和消融,实验结果证明了我们提出的图神经网络说话人后端可以有效提升说话人验证系统的性能。

关键词:说话人验证,图神经网络,说话人嵌入

点击分享码全文pdf浏览:https://rdcu.be/ecxPP

Cite this articleChen, J., Fang, Z. & He, L. Improving Speaker Verification Back-End with Graph Neural Networks. J. Shanghai Jiaotong Univ. (Sci.) (2025). https://doi.org/10.1007/s12204-025-2806-8      

 12204_OF_25_012_GraphAbstract.jpg



https://wap.sciencenet.cn/blog-45888-1485089.html

上一篇:[转载]基于增强现实和超细径摄像头的胸腔闭式引流穿刺可视化系统
下一篇:[转载]基于时变期望间距的ACC/CACC车辆跟驰模型及混合交通流稳定性分析
收藏 IP: 202.120.12.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-11 11:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部