强背景噪声下语音信号端点检测算法的研究及其实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:tpsundl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音信号数字处理技术在人们日常生活中越来越广泛的应用,这些技术的稳定性以及其对使用环境的适应能力都变得越来越重要。由于实际应用环境中背景噪声的存在导致语音质量降低的现象非常普遍,而语音端点检测对语音信号的识别率具有非常重要的影响:另外,准确地检测出语音信号的端点还可以减少后续处理的计算量,提高通讯设备的利用率。如何在噪声环境下准确且稳定地判断语音信号的有无,成为当前语音研究中的一个重要课题。 现有的各种语音端点检测方法在实验室条件下都能达到较高的识别率,但到了存在一定背景噪声,特别是在战场上常见的强背景噪声的应用场合,则性能会急剧下降。本文在深入研究了语音信号与噪声的特征后,提出了改进的基于语音信号短时自相关主副峰比值和基于状态机的语音端点检测算法。实验表明,该算法能在较低信噪比情况下准确地检测出语音信号,而且计算方法简单,能满足战场上部分背景噪音下的语音端点检测。 本文的另外一个主要工作就是研究当今比较热门的小波变换在语音信号端点检测中的应用。在深入地分析了语音信号与常见的战场噪音在小波域不同的能量分布特征后,提出了基于小波多分辨分析的语音信号端点检测算法。该算法首先对语音信号短时帧做多尺度一维小波分解,然后提取尺度为4的高频系数,并求取其均方值,作为判断语音起止点的依据。大量实验表明,该算法应用于背景噪声为战场上常见噪声时的端点检测是非常有效的,并且算法简单,鲁棒性强,可实时实现。 在系统的硬件实现上,本设计采用基于DSP芯片TMS320C6711的方案实现具体的检测算法,外部主要由FPGA和其他外围电路完成控制等相关功能。 论文最后提出了研究总结,还对所提出的新算法在实验中表现出来的问题做了分析讨论,并针对这些问题,提出了改进方案以及本课题今后的研究发展方向。
其他文献
期刊
本文研究了视频信息检索中的一个关键技术——视频字幕的检测与提取,提出了三种算法。(1)基于自适应定位和FCM 分割的视频字幕提取算法。该算法首先进行镜头切换和字幕事件检
期刊
下肢深静脉血栓形成(DVT)的发病率有逐年增加的趋势,高龄、手术、损伤、恶性肿瘤、长期卧床患者发生下肢深静脉血栓的风险明显增加[1]。若不及时处理,可导致病人患肢完全或部分
重症监护中的患儿,具有病情危重、年龄各异等特点,在护理实践中不仅要对患儿提供全面护理,还要关注患儿家长心理问题,进而利于患儿早日康复。本文综述了儿科重症监护中患儿家长的
目的:介绍脑梗塞急性期的护理。方法对70例住院患者严密观察神志、生命体征变化,加强用药护理及心理护理。结果70例患者平均治疗25d,存活50例(其中日常生活基本能自理30例),病情加
在现代通信中,直接序列扩频(DS-SS)通信以其抗干扰能力强、低的截获概率、良好的隐蔽性和保密性,在军事舰载通信中得到广泛应用。本文根据实际舰载扩频通信的需要,采用软件无
目的:总结急性脑梗死动脉溶栓治疗的护理体会。方法:总结我科50例发病6小时内的急性脑梗死患者行尿激酶经动脉选择性溶栓治疗,同时给予术前护理、术后护理、神经功能锻炼与心理
目的::探究喉-口腔术后患者气管切开鼻饲肠内营养护理效果。方法:选择我院2013年2月至2014年12月收治的60例喉-口腔术后的患者为研究对象,随机分为实验组和常规组,实验组30例,常规
语音增强是语音信号处理领域的一项重要技术,用于提高语音通信系统在噪声环境中的性能。语音增强技术广泛应用在语音编码、语音合成和语音识别等诸多领域。因此,对语音增强技术