噪声环境下孤立词语音识别研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:lhasrq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通常人类可以在背景音乐、引擎声音和其他声学噪音环境中识别语音,但自动语音识别(Automatic Speech Recognition,ASR)系统在这种环境中表现不佳。最近在神经科学方面的实验和理论工作已经发现了许多可以用来解决这个问题的方法。本文基于生物启发的ASR方法在噪声环境下进行对ASR稳健性的研究。首先本文对谱时响应野(Spectrotemporal Receptive Field,STRF)进行理论研究,通过对比基于STRF的目标函数和ETSI在不同信噪比环境下的识别率,实验结果证明以听觉神经元STRF为模型的ASR在噪声环境下稳健性有所提高,但其整体性能没有明显改善。其次,本文使用基于尖峰模型神经元的语音表征方法,该方法中的神经元是特征检测器,其在语音的短时间窗口内选择性地响应时间特征。并且提出一种基于支持向量机(Upport Vector Machine,SVM)的训练神经元响应特性的方法,将STRF中的神经元计算结果与先前无辅助手段下的神经响应结果进行比较,发现神经元中的尖峰序列能够提高系统稳健性。本文使用两种方法对基于尖峰的语音表征进行解码,第一种方法使用基于隐马尔可夫模型的经典ASR技术;第二种方法是一种改进的基于模板的识别方法,该方法是基于尖峰序列之间最长公共子序列的语音相似性度量。在不同信噪比环境下进行正交优化实验,实验结果表明性能最优的组合为基于尖峰模型神经元的语音表征和改进的基于模板的识别方法。最后,应用标记音节核心位置的音节检测方法来解码连续语音的尖峰表征,该方法通过将音节信息并入ASR系统,并结合基于SVM的训练与峰值选择算法。使用该方法与传统方法在不同信噪比环境下进行连续语音解码,实验结果表明该方法有效提高在噪声条件下的识别率。然而,该方法在无噪声条件下的识别率低于传统方法。
其他文献
目的探讨新医改背景下中国医药企业营销模式的战略选择。方法解读新医改方案,对两家医药企业(扬子江药业和恒瑞医药)典型的营销模式进行比较分析。结果与结论医药企业营销模
药物稳定性实验的合理设计李冰,蓝静(山东省药品检验所250012)(山东省药物研究所)药物稳定性实验既要符合主管部门的有关要求,又要具有科学性、合理性,通过实验得到的数据必须能够真实地反
基本权利作为一种"客观价值秩序"旨在要求国家机关必须尽到保护人民基本权利的义务,使人民的权利免受公权力或第三方的侵害乃至自然力的威胁。国家所采取保护措施,必须受到"
目的探讨5E康复模式对腹膜透析患者焦虑和抑郁的影响。方法选取180例腹膜透析患者,随机分为两组,对照组采用常规健康教育,实验组实施5E康复干预,主要内容包括鼓励、教育、锻
随着中国钢铁产业的飞速发展,在钢铁工业的快速发展的过程中,大量的资源消耗和严重的环境污染也随之而来,为了使我国钢铁工业的快速且健康发展,国家提出了"努力开发钢铁工业
新疆某煤矿开采过程中存在火烧区、采空区积水问题,这对煤矿的安全生产构成很大的威胁。根据火烧区及采空区积水前后的物性差异,采用瞬变电磁法进行勘探,根据反演计算所得视
<正>1 2012年我国大豆、大豆油供求情况分析1.1大豆生产与消费状况2012年我国大豆种植面积同比大幅减少,虽单产同比上升,但大豆产量仍同比大幅下降。据国家粮油信息中心2013
文章对稳健统计技术在实验室间能力验证中的统计分析设计、数据处理、稳健Z比分数计算、能力评价和能力验证计划结果的报告做了阐述,为能力验证实施机构进行能力验证计划的设
针对神东矿区浅埋易自燃煤层特点,从矿井设计、采矿技术、防灭火材料及工艺等方面开展系统研究,建立了特大井田浅埋藏易自燃煤层自燃灾害防治的技术体系,消除煤炭自燃威胁。
本文以竹炭(BC)为基底材料,苯胺(ANI)为单体,通过原位聚合法、原位乳液聚合法、乳液聚合法和再掺杂法等四种方法制备了具有导电性能的聚苯胺/竹炭复合材料(PANI/BC),并对四种制备方