基于信息熵的语音端点检测算法研究与实现

被引量 : 0次 | 上传用户:hongxing35
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音端点检测就是从指定的一段语音信号中准确的找出语音信号的开始点和终止点,语音端点检测目的是将有效的语音信号和无用的噪声信号区分开。在以往的语音端点检测研究中人们提出了很多种方法,但是这些方法都存在着这样或者那样的缺陷和不足导致语音处理的最终效果都不太尽如人意。所以本文在总结前人的一些优秀思路的基础上尝试提出一种新的算法——基于信息熵的语音端点检测算法。本文首先对基于语音端点检测算法近些年国内外研究学者提出的方法和思想进行了简单的介绍和分析,并对这些算法的优缺点进行了简单的比较。现有的端点检测算法对信噪比较高的语音端点检测效果很好,且这些算法简单实用。但当存在背景噪声时,其性能都有很大程度的下降,有的甚至因此失效。在比较研究了目前常用的语音端点检测算法之后,本文对语音信号的基本概念,比如信息、信号、信息熵及其相关内容进行简单的概括和介绍。由于直接处理输入的语音信号会有很多不方便和误差造成直接处理的效果并不理想,所以,在进行真正的语音信息处理之前往往要进行语音信号的预处理工作。文章接下来就对语音信号的预处理进行了详细的阐述。其中包括语音信号的采集、信号的数字化、分帧加窗处理、以及如何选择窗函数,并且对几种语音信号处理中遇见的常见窗函数在时域和频域、低通和高通等各个方面性能进行了比较。接下来文章主要介绍了与熵相关的概念。包括信息熵的起源、定义、信息熵的算法以及物理意义、信息熵的基本性质,并且对信息熵的应用领域进行了简单的概括和展望。之后文章对基于信息熵的语音端点检测算法进行了详细的理论分析和公式推导。给出了整个语音端点检测的总流程和步骤,在理论上验证了基于信息熵的语音端点检测算法的可行性。最后利用已经验证了的数学推导公式编写应用程序,并且在MATLAB仿真平台上设计出熵的谱函数。得到了熵函数之后记录各个阶段的信息熵值,在进行判定之前讨论了门限值的设定,然后根据得到的信息熵值与预先设定好的门限值进行比较从而判断是语音信号是有声状态还是无声状态,判断语音信号的起始点和终止点。并且通过MATLAB仿真软件的画图函数直观的标示出语音信号的起止点和终止点。实验最终,通过合理的语音与处理工作和熵函数的建立,并在MATLAB仿真软件上进行实际的仿真,对仿真图像进行详细的分析和反复取值进行实验。最后发现当外界环境事是无背景噪声的情况下,这种基于信息熵的语音端点检测算法能够很好的区分语音段和非语音段,由于其受语音的能量影响比较小且具备一定的鲁棒性。然而,实验中仍旧存在着一些不足之处,实验发现,在信噪比较高的时候基于熵的算法表现出良好的鲁棒性,然而,当信噪比降低的时候,算法的鲁棒性还需要有改进的地方,本实验文章的最后对着一方面也进行了讨论和说明。
其他文献
<正> 一论语派自称《论语》是“幽默文学”,而许多文学史的编写者不仅将论语派和“民族主义文学”、“三民主义文学”并列在一起,作为一个“反动的文学派别”加以全盘否定,而
在改革开放进一步推进,经济全球化的大背景下,以胡锦涛为总书记的党中央在十六届四中全会的决议中,提出了构建社会主义和谐社会的目标,会议的根本精神就是和谐,中国共产党的这个社
沼气是一种洁净的生物质能源,是微生物在厌氧条件下将农作物或禽畜粪便中的有机质转化为甲烷气体。农作物秸秆中含有大量的有机物质,通过干发酵工艺不但可以减少焚烧带来的污
本文运用关联理论探讨经典小说《围城》中幽默言语翻译的可译性限度。关联理论作为用来解释交际的语用学理论,由法国学者斯泊伯和英国学者威尔逊在1986年提出,随后产生了广泛
穿龙薯蓣(Dioscorea nipponica Makino.)为薯蓣科薯蓣属多年生缠绕性草质藤本,又名穿山龙、穿地龙、野山药等,广泛分布于内蒙古、黑龙江、吉林、辽宁、山西、安徽、湖南等地
高职体育教育专业经历了一段时间的发展,形成了一定的规模和基础,为国家和社会培养了一批又一批体育教育人才,但还不能完全满足我国基础教育体育与健康教育改革的要求,仍然存
介绍了华北电力大学探索校企联合培养专业学位研究生长效机制的实践措施。华北电力大学依托企业研究生工作站,对专业学位研究生实行"1+1.5"培养模式,充分发挥企业导师在研究
背景白癜风是一种自身免疫相关性疾病,治疗困难。维生素D被证实可抑制异常免疫反应,维持自身免疫稳态。众多临床研究提示血清维生素D水平偏低可能与多种自身免疫疾病的发病及
近年来,随着我国经济建设持续不断的高速发展和人们生活水平的不断提高,城市机动车保有量连年持续增长,机动车已成为各城镇居民出行的主要交通工具之一。但与此同时,利用机动