【摘 要】
:
在人耳听觉语音识别优化过程中,由于在噪声环境下传统语音识别预处理过程不能得到高信噪比的语音信号,使识别率下降。为此结合人耳听觉特性,提出一种基于人耳的听觉选择能力
【机 构】
:
重庆邮电大学信息无障碍工程研发中心
【基金项目】
:
国家科技部国际合作项目(2010DFA12160);重庆市科技攻关项目(CSTC:2010AA2055);重庆市科研项目(KJ13051)
论文部分内容阅读
在人耳听觉语音识别优化过程中,由于在噪声环境下传统语音识别预处理过程不能得到高信噪比的语音信号,使识别率下降。为此结合人耳听觉特性,提出一种基于人耳的听觉选择能力即"鸡尾酒会效应"的语音分离技术应用到语音识别预处理过程。含噪声的语音信号经过耳蜗基底膜模型进行频谱分析,再通过上橄榄核模型进行语音信息提取,最后在下丘脑细胞模型中完成语音分离。分离得到更纯净的语音后,对语音信号提取梅尔频率倒谱(MFCC)参数,并建立隐马尔可夫(HMM)声学模型来验证语音识别效果,实验结果表明:在噪声环境下,相比于传统抗噪方法,改进方法具有更好的抗噪效果,表明上述语音识别系统具有更好的鲁棒性。
其他文献
本文将要介绍的补偿装置是一种智能无功形式的研究方案,对于电参数的采集,本装置采用的智能模块为EDA9033K型,很好的解决了10kV高压配电网无法提供充足的无功补偿问题。在对
胰岛素是由A(21个氨基酸残基)、B(30个氨基酸残基)2条多肽链构成的具有生物活性的蛋白质激素。它是由胰岛β细胞合成的前胰岛素原,经相关酶的催化,切除部分氨基酸残基,形成的
<正> 免疫学的发展,对于胸腺的作用已有初步的了解,认为它是和中枢淋巴器官一样在机体免疫学中起着重要的作用,而胸腺又和重症肌无力症的发生发展有密切关系。我科近年来以培
随着全球气候变化日趋明朗和世界性粮食安全危机日益严重,农作物对气候变化的响应及应对气候变化的措施已经成为作物科学的研究热点。江淮地区是我国粮食生产的主要区域,探讨
从侵占罪客观方面的成立要素的内容来看,在把握“侵占”的含义时,应以占有说为宜,即只要具有变持有为所有的意思表示,即为侵占。当然,要成立侵占罪,还必须具备“拒不退还”的条件,这
九江作为江西省造船企业比较集中的地区和主要船舶制造业基地,在江西省船舶工业中发挥着越来越重要的作用。在这次金融危机中,九江船舶工业的现状如何?受冲击的程度如何?能否
<正>我国城市河流有90%左右受到污染,出现水体滞流、多处于厌氧状态、复氧能力差、淤积严重、透明度低、甚至发生黑臭等现象。由于城市水体污染负荷远远超过城市有限受纳水体
<正> 在急性热性病过程中,尤其在病情危重阶段,由于邪毒炽盛,热邪郁闭于里,不能透达于外,邪毒阻闭脉络,阳气被遏,阴阳之气不相顺接,在出现高热或胸腹灼热,口渴饮冷,烦躁不安,
中国烟草专卖制度改革的目标应该是:在坚持专卖体制、保证国家税收收入的前提下,适应社会主义市场经济体制的要求,引入市场竞争机制,发挥市场机制在资源配置中的基础性作用,