基于MTL-DNN系统融合的混合语言模型语音识别方法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:tttde123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于混合语言模型的语音识别系统虽然具有可以识别集外词的优点,但是集外词识别准确率远低于集内词。为了进一步提升混合语音识别系统的识别性能,本文提出了一种基于互补声学模型的多系统融合方法。首先,通过采用不同的声学建模单元,构建了两套基于隐马尔科夫模型和深层神经网络(Hidden Markov model and deep neural network,HMM-DNN)的混合语音识别系统;然后,针对这两种识别任务之间的关联性,采用多任务学习(Multi-task learning DNN,MTL-DNN)思想,实现DNN网络输入层和隐含层的共享,并通过联合训练提高建模精度。最后,采用ROVER(Recognizer output voting error reduction)方法对两套系统的输出结果进行融合。实验结果表明,相比于单任务学习DNN(Single-task learning DNN,STL-DNN)建模方式,MTL-DNN可以获得更好的识别性能;将两个系统的输出进行融合,能够进一步降低词错误率。
其他文献
在甲状腺疾病的临床诊治中基层医生承担着首诊工作,但是由于其专业知识所限和不了解如何与内分泌专科医生分工协作,导致甲状腺疾病的误诊误治和各级医生诊治分工不明确的现象严
上个世纪的五十年代至七十年代,毛泽东领导中国共产党进行了二十年的反修斗争。实际上中国并没有修正主义上台。毛泽东错误地把国内外对于“三面红旗”的批评看成是反马克思主
通过文献资料调研、归纳比较分析、数理统计法将第23届~30届的奥运会田径项目金牌奖牌进行统计分析,对奖牌的设立与分布走势,奖牌总数分布的洲际实力比较以及田径项目实力分析
根据国内外的大量试验资料,采用数理统计和理论分析相结合的方法,研究了混凝土强度、剪跨比和配筋率对集中荷载作用下钢筋混凝土无腹筋梁的受剪承载力影响规律。提出的集中荷载
术后谵妄和认知功能障碍是一种临床常见的急性脑功能障碍综合征,外科病人手术后的发病率可高达70%。术后谵妄和认知功能障碍对病人近期和远期康复均会产生不良影响。除增加术
阐述老年心理健康标准的基本界定,生活质量的评估指标,分析老人心理的几种类型,影响老年人心理健康的主要因素,探讨如何让老年人做好自我心理保健,提高生活质量。
本文提出了一种用于电能计量芯片的基波频率测量算法。其创新点是从系统设计出发,把基波频率测量与电能计量中过采样ADC的梳状积分级联抽取滤波(以下简称CIC)过程相结合,利用
暴筋是成品膜卷上手感硬性的条纹,本文总结出暴筋形成的四个原因,每种原因下暴筋主要特点和解决方法,希望提高生产厂家的产品质量和经济效益。
目的分析肾脏良恶性肿瘤超声造影(CEUS)时间-强度曲线(TIC)特点,探讨相对超声造影参数在鉴别肾脏良恶性肿瘤中的临床应用价值。方法对大连医科大学附属第一医院的67例经病理
近年来,光明食品集团从积极争取政府支农资金,改善农业基础设施,到优先加大农业投入.改善农业生产条件;从努力发展支撑产业.鼓励反哺农业,到倡导科技强企.推进农业创新,在农业的生产模