语音端点检测方法研究

被引量 : 0次 | 上传用户:comeandsit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音端点检测是指在背景噪声存在下,找到一个单词或语音段的起始点和结束点。它在语音识别、语音编码和语音传输等语音信号处理中起着重要作用。一种有效的端点检测方法,不仅能正确标识语音端点,而且能减少数据处理时间、提高效率和节省数据存储空间。本文介绍了语音信号的产生模型和人耳听觉特性,分析了语音分帧和加窗这些预处理过程。简要回顾了常用的端点检测方法,如短时能量和过零率法、谱方差法、MFCC倒谱距离法和谱熵法等。总结了各种常用算法的思想、流程及特点,并给出了各算法所用特征参数曲线图。提出了两种新的端点检测算法:(1)提出了一种改进的自适应子带谱方差端点检测方法。因为不同类型噪声的频率能量集中在不同的频率带上,所以可以通过准确地去掉这些含有太多噪声的频率带,并自适应地选择有用子带能量,来得到更多准确的语音频率谱信息。使语音段方差和噪声段方差之间的区分度变大,端点检测更容易,准确率更高。同时有效减少了需处理的语音数据,提高系统整体性能。并将该算法应用到高斯连续HMM语音识别系统中,实验表明,该算法提高了识别系统准确率及抗噪性。(2)提出了一种无前导静音段语音的端点检测算法。基于阈值的端点检测方法假设语音起始段为无语音的静音段,并根据该无语音的起始段的特征值设置阈值。如果检测的语音帧的特征值大于阈值,就认为该帧是语音帧,否则认为该帧是噪声帧。若该假设不成立,预设的阈值将不可用,最终导致端点检测错误。本文通过FCM聚类方法避开了阈值设置问题。该算法在检测无前导静音段语音时,表现出了很好的性能。
其他文献
目的:探讨CT、MRI及超声检查在体表窦瘘中的应用价值。方法:回顾性分析53例体表窦瘘患者的临床和影像资料,患者术前均行CT、MRI及超声检查,对照手术所见,评价3种影像学方法对
近些年来,人工超材料及超表面的研究引起了学术界的广泛关注。通过设计不同的超材料及超表面结构,人们可以实现对电磁波的自由操控。本文主要从三个方面,包括电磁波的透射调
针对传统建筑节能方法与实际结果拟合度稳定性差、能源利用率低的问题,提出基于BIM技术的建筑节能结构协同设计.应用建筑多指标能耗函数,完成建筑总能耗数据的计算,通过对空
秉持着我国绿色发展的核心理念,我国对于水产养殖的自身污染防治工作,也越发看重,如何在确保农户经济利益的前提下,提升水产养殖污染防治工作,是目前我国各级农业部门的工作
保护和加强农村生态环境建设是农业增效、农民增收、农村增绿的内在要求,是实现可持续发展、推进美丽中国建设的重要举措,也是建设社会主义新农村的有力保障。齐齐哈尔市长青
21世纪是信息化时代,互联网的运用极大地改变了我们的生活方式,互联网行业也在国家政策的扶持下欣欣向荣。伴随着互联网行业的飞速发展,大量的风险投资也应运而生。在接受风
近几年来,茶饮料正日益受到消费者的普遍欢迎。然而,在目前茶饮料行业如日中天的发展势头下,大多数的茶饮料企业却忽略甚至于缺乏对市场营销策略的认识,遑论其恰当运用。本文
提高员工忠诚度有利于提高工作效率,节约成本,增强企业凝聚力。但是目前很多人由于受到经济利益驱使、企业内部因素以及员工自身因素的影响,对企业的忠诚度下降,造成企业员工
近年来,随着互联网经济的发展,旅游业也逐渐走信息化发展道路。本文结合目前四川省旅游业发展的现状,就未来如何加强旅游业的信息化建设提出了若干对策和建议,以期能够全面提
随着全国高校工商管理专业办学规模的不断扩大和就业形势的日益严峻,对其进行教学改革与创新势在必行。笔者通过参考本校近三届400多名专科毕业生就业的抽样调研信息和近百家