基于特征提取的抗噪声语音识别研究

被引量 : 0次 | 上传用户:m634606037
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噪声环境下的语音识别是一个很重要的课题,在许多场合有广泛的应用。本文主要研究基于特征提取的抗噪声语音识别问题。现有的语音识别系统对于清晰语音有着令人满意的识别结果,但在许多实际环境中,特别是在背景噪声存在的情况下,它们的性能将会大幅度地下降,这也是语音识别系统不能商业化的主要原因之一。解决噪声背景下的语音识别问题有三种方法,即采用抗噪声的语音特征和相似测度、语音增强、语音模板的噪声补偿等。本论文围绕前两种方法进行研究,主要贡献如下: 1.提出了一种改进的基于谱相减的语音特征提取方法。在谱相减法语音增强中,用无音期间的噪声信号作为目前帧的干扰噪声,这会导致清晰语音功率谱或幅度谱的估计值存在误差。本文提出的改进方法能够减小这种误差对提取的语音特征的影响。实验结果表明,和语音信号先谱相减增强再提取特征的方法相比,用这种方法从带噪语音中提取的MFCC特征矢量更接近于纯净语音的特征矢量,并且极大地提高了识别系统对带噪语音的识别率。 2.提出了功率谱差分的概念,并在此基础上,提出了一种抗噪声的语音特征。计算功率谱的差分相当于在功率谱域滤除带噪语音中的加性噪声。首先让语音信号的功率谱通过一组带通滤波器,再计算各滤波器输出的差分值。理论分析和实验一致证明,以此作为语音信号的特征,可以大幅度提高语音识别系统在噪声环境中的性能。 3.提出了基于单边自相关序列的语音特征OSA-MFCC。虽然Hernando等人提出的语音特征OSALPC也是基于单边自相关序列的抗噪声语音特征,但在提取OSA-MFCC特征和OSALPC特征时,单边自相关序列的计算方法不同,并且在提取特征时用到的单边自相关序列长度不同。带噪语音的识别实验表明,OSA-MFCC的抗噪声能力远远强于OSALPC。 4.提出了基于奇异值分解滤波的多模板语音识别的方法,推导了语音模板的参数重估公式。奇异值分解滤波虽然可以提高带噪语音信号的信噪比和对带噪语音的识别率,但不同的滤波参数只能保证识别系统在某一较小的信噪比范围内
其他文献
目前人寿保险行业已经成为我国经济建设中一支重要力量。2004年底,保险公司持有国债2651.7亿元、金融债1156.8亿元、企业债687.6亿元、协议存款3709.4亿元,其中绝大部分资金
中医治疗哮喘历史久远,早在2000多年前的《黄帝内经》就有记载,历代医家对其认识又各有不同。现通过对哮喘的病因病机、辨证分型及中医药治疗等资料进行挖掘整理,从而总结出
从湘西丰富而独具特色的民俗旅游资源出发,阐述湘西民俗旅游资源开发的必要性及可开发项目,对民俗旅游经济作出特征分析,为湘西经济发展与规划提供参考.
冬虫夏草(以下简称虫草)是我国传统的滋补中药。是临床用于抗肿瘤及治疗肾病的重要药物。虫草具备多种药理作用,可通过干预一种或多种途径发挥减缓、对抗多种疾病的作用。
为明确大学生农村创业工作在新型城镇化建设中的地位和作用,通过对新型城镇化的概念、目标、实现途径及农村科技创业人才困境进行分析,指出大学生农村创业不仅可以缓解高校毕
目的 观察筋针平刺治疗腰椎间盘突出症患者的效果及优势。方法 选取2017年8月—2019年2月接治的60例腰椎间盘突出症患者,按患者就诊先后顺序收集60例患者资料,随机分成A、B组
<正>高考刚结束,填报志愿成了令考生们或犹疑或纠结的头等大事。哪些专业发展前景好,就业率高?哪些专业月收入和就业满意度好?当前大学生就业率与就业环境究竟如何?这些问题
信息技术的迅猛发展,导致一场前所未有的信息革命和全球信息化浪潮遍及社会生活的各个方面。在社会竞争越来越激烈的今天,企业只有通过信息化,加快发展,提高核心:竞争力,才能有效应
金、银纳米粒子作为贵金属纳米粒子的典型代表,具备了金属纳米粒子的诸多独特的特性,并以其独特的光学、电学、磁学特性在环境、医药、生物领域的应用受到了研究学者的广泛关注