大工至善|大学至真分享 http://blog.sciencenet.cn/u/lcj2212916

博文

[转载]【计算机科学】【2018.05】基于时延神经网络的混响鲁棒声学建模

已有 142 次阅读 2021-2-27 16:07 |系统分类:科研笔记|文章来源:转载

图片


本文为美国卡耐基梅隆大学(作者:Emanuel Jöbstl)的硕士论文,共73页。

 

本文研究了基于隐马尔可夫模型的鲁棒声学建模,用于语音识别系统。本文的工作重点是时延神经网络。我们首先设计了一个用于声学建模的时延神经网络模型,并给出了实验结果,证明了我们对设计参数的选择是正确的。然后,我们在增广数据上训练时延神经网络,并将其与传统的全连接神经网络在混响数据上的性能进行了比较。  

 

This work investigates robust acoustic modeling for speech recognition systems based on hidden Markov models. The focus of this work is put on time delay neural networks. We first design a time delay neural network model for acoustic modeling and provide empirical results that justify our choice of design parameters. Then, we train the time delay neural network on augmented data, and compare its performance on reverberated data with conventional fully connected neural networks.

 

1.       引言

2. 基础知识

3. 相关工作

4. TDNN声学模型设计

5. 混响数据评估

6. 结论

附录最优解码器参数


更多精彩文章请关注公众号:205328s611i1aqxbbgxv19.jpg




http://wap.sciencenet.cn/blog-69686-1274134.html

上一篇:[转载]【电子技术】【2014.05】【含源码】以ARM CORTEX-M4F为核心的STM32单片机实时操作系统实现
下一篇:[转载]【统计学】【2014】双相情感障碍的数学建模、预测和远程监测

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-4-21 07:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部