卷积神经网络用于远程语音识别
来源:56doc.com 资料编号:5D23808 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D23808
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 密 保 惠 帮助
资料介绍
卷积神经网络用于远程语音识别(中文5000字,英文PDF)
摘要
我们研究了卷积神经网络(CNNs)用于大词汇远程语音识别,从单个远程麦克风(SDM)到多个远程麦克风(MDM)记录的语音进行训练。在MDM情况下,我们探索了与直接使用多个声学通道作为CNN的并行输入相比,波束形成信号输入的表示方法,探索了不同的权重共享方法,并提出了一种双向汇集的信道方式卷积。我们在使用AMI会议语料库进行的实验中发现,相较于传统的深度神经网络(DNN),CNNs提高了6.5%的字错误率(WER),而相较于相差训练的高斯混合模型(GMM)基线,提高了15.7%。对于跨频道的CNN训练,相对于比较型DNN结构,WER提高了3.5%。而与最佳波束形成的GMM系统相比,跨频道卷积相对将WER降低了9.7%,并且达到了波束形成DNN的精度。
关键词:AMI语料库,卷积神经网络,深度神经网络,远程语音识别,会议。
|