基于短时能量过零率和功率谱熵的语音端点检测

来源 :数字化用户 | 被引量 : 0次 | 上传用户:harrydu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】随着语音技术的发展,语音识别技术应用到各个领域,而端点检测是语音识别系统中至关重要的一个环节,语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难,信噪比下降,本文就基于短时能量过零率和基于功率谱熵对所采集的音频文件进行端点检测,然后对处理后的音频进行频谱分析、对比,得出基于功率谱熵的端点检测的鲁棒性比较好,识别效果比较好。
  【关键词】短时能量过零率 功率谱熵 端点检测 鲁棒性
  一、引言
  语音端点检测是指从含噪语音中找到语音段的起始点,端点检测对孤立词识别非常关键,语音识别一半以上的错误是由错误的端点检测导致的.准确的端点检测还可以降低后续处理时间和存储空间,使语音识别系统性能达到最佳.
  目前,基于能量的方法是目前语音端点检测广泛使用的方法,它在高信噪比条件下效果很好,但是当信噪比很低时,纯粹的能量参数效果不再令人满意。本文就基于短时能量过零率和基于功率谱熵对所采集的音频文件进行端点检测,分析对比证实了基于功率谱熵对语音识别有比较好的识别性。
  二、理论概述
  (一)基于短时能量和过零率的端点检测
  1、短时能量
  由于语音信号的短时性,因此对数字化后的语音信号一般进行分帧处理,并认为1帧内信号的频谱特征和某些物理特征参量近似看做不变。1帧内的信号能量称为短时能量。
  语音和噪声的区别可以体现在它们的能量上,语音段的能量比噪声段能量大,语音段的能量是噪声段能量叠加语音声波能量的和。在信噪比很高时,那么只要计算输入信号的短时能量或短时平均幅度就能够把语音段和噪声背景区分开。
  设第n帧语音信号的短时能量用En表示,则信号的短时能量定义为: 式中,N为信号帧长。
  2、过零率
  短时过零表示一帧语音信号波形穿过横轴(零电平)的次数。过零分析是语音时域分析中最简单的一种。对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值的改变符号称为过零。过零率就是样本改变符号次数。
  定义信号的短时平均过零率Zn为:
  式中,为符号函数,即:
  3、过零率的修正
  为尽可能减少低频的干扰,在实际应用中往往对过零率做出简单的修正,修正的方法是对上面的定义做一些修改,即设定一个门限T,将过零率的定义修改为穿越该门限的次数。
  于是,有定义:
  (二)基于熵函数的语音端点检测
  ShenJ L 首先将熵的概念引入到语音信号处理中,利用幅度谱熵在語音段与非语音段上频谱的差异达到检测语音端点的目的。在信息论中,用熵来表征信源输出的平均信息量,假设信源发出有限个符号 ,它们组成的输出序列前后符号之间相互统计独立, 分别为 n个符号出现的概率,其定义式如下:
  信源熵是概率分布的函数,而且概率分布越平坦熵值就越大。熵函数语音端点检测就是通过检测语音频谱的平坦程度来实现的。对于非语音段,其能量比较平稳的分布在各个频率,因而其频谱熵比较大。而对于语音段,声音的能量主要集中在某几个频段上,因而其频谱熵比较小。于是可以根据语音段和非语音段在谱熵上的差异来实现语音端点的检测本文中采用功率谱熵的方法,功率谱熵函数的构造构成如下:
  首先对语音进行分帧加汉明窗,帧成为256,帧移128,对每帧语音信号计算其短时自相关序列,对得到的序列进行傅里叶变换即可得到功率谱密度。各频率分量的归一化功率谱密度函数可表示为:
  式中表示信号经过FFT变换后的频谱分量:表示某个频率分量i所对应的概率密度函数;N表示FFT变换的长度(本文取256点)。考虑到语音信号类似于功率信号,同时根据功率谱密度的对称性,只取FFT一半的点来构造以减少计算量。所以实际运用中采用下式来计算归一化功率谱密度函数
  对应的每一帧语音信号的信息熵定义为
  H=
  由以上功率谱熵函数的构造过程可以看到熵的大小由功率谱的方差来决定而不是信号的幅度,幅度的大小不会影响归一化功率谱密度函数,语音信号的谱熵特征分析都是通过检测谱的平坦程度,从而达到语音端点检测的目的。对于无声段,它的能量在各频率的分布比较平稳,反映到信息量上,认为其所含的平均信息量即谱熵较大;而对于语音段,它的能量集中于某几个频段,起伏突变大,那么它所含的平均信息量即谱熵较小,于是可以利用两者谱熵的差异,进行语音段和无声段的划分。并且理论上,如果谱的分布保持不变,信号幅值的大小不会影响.。因而,功率谱熵对噪声有一定的稳健性。
  三、MATLAB对采集到的音频进行端点检测实验
  在本论文所采集的音频信号中,拨号音相当于语音段(有声段),其他的为静音段(噪声段),拨号音段平均能量最高,静音段平均能量相对较低,整个端点检测可分为四段:静音段、过渡段、拨号段、结束。使用一个变量表示当前状态。静音段,如果能量或过零率超过低门限,就开始标记起始点,进入过渡段。过渡段当两个参数值都回落到低门限以下,就将当前状态恢复到静音状态。而如果过渡段中两个参数中的任一个超过高门限,即被认为进入拨号段。处于拨号段时,如果两参数降低到门限以下,而且总的计时长度小于最短时间门限,则认为是一段噪音,继续扫描以后的拨号音数据,直至标记结束点。从而达到分离出单个拨号音的效果。
  低噪音音频875417基于短时能量过零率端点检测 低噪音音频875417基于功率谱熵的端点检测。
  四、总结
  本文分别利用短时能量过零率和功率谱熵对银行卡密码,手机号,银行卡号所采集的音频数据进行端点检测实验,此实验是在适当低噪音下采集的,结果显示功率谱熵的检测效果会好点,而且鲁棒性比较好,但如果噪声再高点,功率谱熵的结果也不好,故本文有待于进一步研究。
  参考文献:
  [1]Dean J,Krusienski.Nvestigations Into Using Matlab For Acoustical Adaptive Filtering[J]. REU PENN STATE Annual Research, 2003, 1: 45-53.
  [2]陈亚勇.MATLAB 信号处理详解[M]. 北京:人民邮电出版社,2000.
  [3]程佩青.数字信号处理.第三版[M]. 北京:清华大学出版社,2008.
  [4]Navarro-Mesa, J.An improved speech endpoint detection system in noisy environments by means of third-order spectra[J]. IEEE Signal Processing Letters, 1999, 6(9): 224-226.
  基金项目:
  国家自然基金(61275120)
  作者简介:
  葛艳(1987—),女,山西吕梁,硕士,研究生,研究方向:语音端点检测。
其他文献
【摘 要】随着移动互联网的飞速发展,移动终端设备(如智能手机、平板电脑)因其携带方便以及可随时随地接入互联网的优势,而使其成为多数人访问网络的主要工具。但由于同一个网页在不同尺寸大小的屏幕上的显示效果是不同的,这就需要利用响应式Web设计的实现方法使网页做到自动适应屏幕的大小。本文从弹性布局、弹性图片和媒体查询三个方面阐述了响应式Web设计的实现方法。  【关键词】响应式Web设计;移动终端;布局
期刊
【摘 要】随着Internet的快速发展,Web技术、数据库技术的进一步成熟,为了对传统的组织学与胚胎学实验教学法进行改革。根据素质教育的要求,为了加强创新精神和实践能力的培养,充分利用网络和多媒体技术开发网上开放式实验教学应用系统,以实现教学在时间和空间的网上开放。  【关键词】网络;组织胚胎学;开放式实验教学系统;  引 言  随着信息技术在管理上越来越深入而广泛的应用,开放式教学系统的实施在
期刊
【摘 要】随着经济建设的迅猛发展,城市化进程步伐的不断加快,用户对供电质量的期望值越来越高,将电力企业服务社会的性质推向了一个新的高度。10kV配网是电力系统与用户直接相连的重要环节,点多线长面广,运行环境较为复杂,它的安全运行水平直接影响供电企业的经济效益和社会效益。如何提高配电网的供电可靠性,从而保证电网的安全、经济和稳定运行,更好地满足社会经济发展的需要,是我们每个电力人都要反复思考的问题。
期刊
【摘 要】利用信息技术促进机电系统运维管理精细化,结合实际工作情况,提出机电运维管理信息系统需要实现的主要内容。  【关键词】信息技术;机电系统;精细化  随着中信渝黔高速公路业务的发展,公司在机电系统软、硬件的投入不断增加。同时,对公司机电系统责任部门的维护管理水平、维护成本控制、设备维护的及时性、有效性等管理工作也提出了更高的要求。精细化管理是在常规管理的基础上,进一步将管理工作做精、做细,以
期刊
【摘 要】随着企业的发展以及各级管理层的决策落实,督办事项时效性、实效性要求越来越高,各项重点工作管理也越來越重要,如何借助信息化手段,实现工作任务的督办管理成为一项实际应用课题。该文结合任务督办管理系统的建设实践,简要阐述了如何通过建立便捷、畅通、协同、高效的任务督办管理系统,实现工作任务闭环管控的信息化管理。  【关键字】任务督办,管理系统,信息化  一、建设背景  随着企业的发展,协同办公等
期刊
【摘 要】随着城市交通的快速发展,交通信息情况变得日益复杂,及时掌握交通通信系统并建立一套完整科学的交通通信程控机系统成为了当前的主要任务,交通程控机是交通系统的主设备之一,决定着整个道路系统的功能情况和运营情况,结合当前快速发展的交通信息化趋势,解决交通发展的质量、效益、安全及服务的根本问题,加快产业化升级和结构调整,把信息化建设放在了重要地位,具有重要的发展意义,本文对交通通信程控机系统功能分
期刊
【摘 要】随着中国经济长期平稳较快发展,能源建设取得了巨大成就,电网是现代能源产业体系的重要组成部分。智能电网代表未来电网的发展方向,越来越受到世界各国的关注,特别是在可再生能源接入、智能配电、智能用电、微网系统和大容量储能等领域新技术。  【关键词】智能电网;构成;主要功能和特征;发展方向  智能电网就是电网的智能化,它是建立在集成的、高速双向通信网络的基础上,通过先进的传感和测量技术、先进的设
期刊
【摘 要】随着高速公路交通需求的迅速增长,收费站已成为公路交通的瓶颈地段,不停车收费系统的应用是交通技术发展的必然趋势。基于计算机术进行不停车收费系统仿真设计,克服了无法进行物理实验的不足,确保了系统搭建的可靠性。  【关键词】计算机技术;高速公路;不停车收费系统;仿真分析  一、引言  随着经济的快速发展,交通需求迅速增长,高速公路收费站可能成为交通的瓶颈,所以收费站的容量设计及作业方式对高速公
期刊
【摘 要】作为新型教学模式,视频教学对大学计算机教学影响深远,其必然会促使这门课程的教学方式、技术、理念等的全面改革,高校基础设施、师资缺乏现状也会因此扭转。  【关键词】视频教学 高校教改 影响  视频资源的诞生彻底改变了社会公众的生活方式、思维。校园传统教学方式也因此而被全面颠覆,教学效率不降反升。2007年,国家教育部于其发布的2号文件内描述道:必须持续培养、增强教师制作、运用信息技术、多媒
期刊
【摘 要】当下电子商务不断发展,网络用户对产品的评论也日益多样化,通过网络用户的评论对产品的特征进行研究对企业的发展有着重要意义。在网络用户的评论中挖掘产品特征能够帮助生产商和服务商对产品进行改良,不断满足消费者的需求,提高市场竞争力。但是,随着现代科技的不断发展,在网络客户评论的信息中,有用的信息越来越少,要通过一定的技术进行筛选,才能挖掘出产品特征。本文将针对电子商务中网络客户评论,提出产品特
期刊