噪音环境中语音信号的端点检测和基于仿生模式识别的语音识别方法研究

来源 :中国科学院半导体研究所 | 被引量 : 0次 | 上传用户:jigmei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了能有效地利用语言这种人类最自然、简便和有效的交流方式,研究者们希望机器能够自动地理解和识别人类的语音信号,并将其转变成相应的文本文件或命令,把人类从某些繁琐的操作中解脱出来,即实现语音的自动识别.由于语音识别具有辉煌的应用前景,它一直是近年来模式识别和人工智能等领域的研究热点.一个完整的语音识别系统就是对于输入的音频信号,首先判断其中是否包含语音信号,如果包含,就将语音段和非语音段区分开来(这一部分通常称作端点检测或语音分段),然后对语音段的信号进行特征提取,最后根据提取出来的特征矢量识别语音内容.论文首先就语音的端点检测和识别领域的历史发展和研究现状进行了回顾,对各种检测和识别算法的理论依据和具体实现方法做了较详细的介绍,并简单比较了各种方法的优劣所在.然后对语音的端点检测和识别两方面内容作了一些初步的分析和研究工作.目前安静环境中的孤立词语音识别技术已经相当成熟,语音识别领域研究的重点和难点主要集中在大词汇量连续语音识别和噪音环境中的语音识别两个方面.噪音环境中语音识别的最大困难在于如何将语音信号从背景噪声中提取出来,即语音信号的端点检测问题,在深入分析现有端点检测方法优缺点的基础上,该文提出了一种新的端点检测方法,这种方法直接利用人类语音的频带分布特点,用250-3500Hz频带内的能量和全频带范围内的能量之比,即频能比(FER),作为区分语音(主要是元音)和噪音信号的主要参数,然后使用过零率判断辅音信号的有无,从而确定语音信号的准确端点.实验证明,该方法可以快速准确地在噪音环境中将语音信号检测出来,是行之有效的,为实现噪音环境中语音信号的正确识别打下了良好的基础.另外,该文介绍了基于仿生模式识别的语音识别系统的原理及实现,并将它与现有的几种语音识别方法,包括:分段矢量量化(SVQ),动态时间弯折(DTW)和隐马尔可夫模型(HMM)三种,进行了比较,实验验证和分析了仿生模式识别和良好识别能力,重点讨论了在少量样本情况下仿生模式识别远远优于其它语音识别方法的原因.
其他文献
2009年5月26日,深交所在深圳组织召开了中小企业板(以下简称“中小板”)成立五周年座谈会,中国证监会、工业和信息化部、科技部等相关部们领导,地方证监局、部分省市政府相关
抑素蛋白(Prohibitin,PHB)是一类泛素化、功能众多并广泛分布的蛋白,PHB在细胞中的分布主要是在线粒体、细胞核及细胞膜的脂筏中。PHB参与了许多重要生理病理功能,如维持线粒体的
以塔里木河下游为研究区,采用植被定位监测与野外激活土壤种子库相结合的研究方法,于2006年选择了5个不同退化程度的断面,进行土壤种子库样品采集和植被调查,并开展了野外土壤种
许多革兰氏阴性菌面临不良环境时可能会进入“活的非可培养状态(viablebut non-culturable,VBNC)”以维持生存。当致病菌进入此状态时,在国标规定的检测培养基上不能生长形成
在非真空环境下,我们使用一种简单的热蒸发方法在硅基底上合成了单晶的氧化锌一维纳米材料.该制备方法和其它制备方法不同的是没有引入其它材料作为催化剂.在制备过程中,基底
近年来,氮化镓(GaN)材料越来越受到人们的关注。它具有很多优点:禁带宽,是直接带隙材料,电子饱和速率高,导热性能好,击穿电场高,介电常数小,热稳定性好,化学稳定性强。GaN的禁带宽度大
智能车载导航监控终端是智能交通系统(ITS)的重要组成部分,它也将逐渐成为汽车电子产品的必备组件.智能车载导航监控终端综合运用GPS定位、空间信息处理、计算机网络、人工智
该论文的目的是探索一种获得高峰值功率、高外差频率稳定度激光器的方法,从而为激光雷达提供理想的光源.为满足上述要求,我们设计了双通道部分Z折叠共电极电光调Q射频激励波
在新课程改革的背景下,初中语文也有了新的进展,为教学内容以及授课方式上注入了新的活力,但是初中语文教学中仍存在着瓶颈。笔者以初中语文为切入点,对语文教学的瓶颈进行分析,并
水资源短缺已经成为世界性的环境问题之一,缺水已经困扰着诸多地区经济社会的发展。随着我国为解决西北、华北地区严重缺水的南水北调工程的开工建设,如何确保水源地水质安全日