【摘 要】
:
针对多噪音环境下的语音识别问题,提出了将环境噪音作为语音识别上下文考虑的层级语音识别模型。该模型由含噪语音分类模型和特定噪音环境下的声学模型两层组成,通过含噪语音
【基金项目】
:
国家自然科学基金(61672523)
论文部分内容阅读
针对多噪音环境下的语音识别问题,提出了将环境噪音作为语音识别上下文考虑的层级语音识别模型。该模型由含噪语音分类模型和特定噪音环境下的声学模型两层组成,通过含噪语音分类模型降低训练数据与测试数据的差异,消除了特征空间研究对噪音稳定性的限制并且解决了传统多类型训练造成的某些噪音环境下识别准确率降低的弊端,又通过深度神经网络(DNN)进行声学模型建模,进一步增强声学模型分辨噪音的能力,从而提高模型空间语音识别的噪音鲁棒性。实验与多类型训练得到的基准模型进行对比,结果显示层级语音识别模型较该基准模型的WER值相对降低了20.3%,表明层级语音识别模型有利于增强语音识别的噪音鲁棒性。
其他文献
<正>随着碳市场发展日趋成熟以及合作减排的需要,建立全球碳市场的趋势愈加明显。近年来国际上已建立的成功实现链接的碳排放权交易体系,包括欧盟—挪威和美国加州—加拿大魁
一般在自然界对虾性成熟时要迁移到深海产卵,孵出来的无节幼体再漂浮到近海生长发育到幼虾,再被人们采集来放在海边池塘内饲养到出售。但现在国外用控制激素的办法,人工繁殖
随着时代的发展变迁,市场对于柔性电子器件的需求越来越明显,柔性透明导电材料是实现柔性器件的关键之一。银纳米线透明导电薄膜具有优异的光学和电学性能,在柔性器件等领域
分析了现有负荷控制终端的接入技术,无线专网对比光纤通信具有建设成本低,业务接入灵活的特点,为负荷控制终端的接入提供了重要的补充解决方案。详细介绍了无线专网的性能测
中央政府采购网开通于2004年1月,是国务院机关事务管理局中央国家机关政府采购中心(以下简称“国采中心”)建设运维的电子化采购交易执行平台。2008年网站升级时,国采中心选择用
目的探讨集束化护理干预对心脏介入股动静脉入路术后患者非切口疼痛的影响。方法将2017年7月-2018年7月行心脏介入股动静脉入路术后患者200例,采取随机数字表法随机分为观察
为调查了解内蒙古乌审旗地区自然放牧绵羊主要蠕虫病的流行情况,并为当地牧民制定较为可行的驱虫方案,本研究于2009年3月至4月,对乌审旗不同地区的绵羊群进行了蠕虫病流行病
<正> 如果把语法系统比作一座语言大厦的构架,那么词汇就是这座大厦的建筑材料。对词汇系统的正确认识与合理运用是掌握一门语言的必由之路。在汉语学习进入高级阶段时,词语
哲学家布封从哲学的角度说:“风格就是人。”如从艺术的角度来说,“风格就是艺术的境界。”教学风格其实就是一门“配角艺术”。我们看一个教师的教学风格,或者说评价一位教师的
<正>在青年和老年人中,年龄对反射波增强指数(augmentation index,AIx)的作用不同,且AIx在60岁后达到平台期。该研究探讨在青年和老年人,有无高血压或有无高AIx的受试者中,年