语音信号端点检测算法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:entine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前信息科技时代,语音信号识别(ASR)技术、语音信号编码(ASC)技术、及语音信号增强(ASE)技术[1]将会在安防领域、人机交互领域、通信领域以及未来的消费电子产品领域[2]产生强有力的技术支撑作用。通过语音信号端点检测技术,可以准确地分析出一段语音信号中的纯语音信号和静音段[3],该技术直接对ASR、ASE技术的性能和ASC技术的效率产生决定性影响[4]。可以用三个环节来表征一个完整的语音端点检测模型:首先,语音信号预处理环节,包括信号滤波、语音流分帧以及信号加窗等[5]。其次,提取整个语音流的特征向量,小波分析(WA)技术的多分辨率解析特性是提取语音信号特征向量的极好方法[6]。最后,语音端点判别模型的建立[7]。传统的语音端点检测算法有基于时域的双门限法、基于频域的普熵法以及基于倒普特征的检测方法等。针对在低信噪比和复杂的噪声环境下,为了得到满意的端点检测效果,本文提出了基于优化极限学习机(ELM)的端点检测模型,通过优化网络连接参数以弥补算法本身的不足。(1)为了优化ELM神经网络的输入权值和隐含层偏差,结合粒子群优化(PSO)算法,形成了粒子群优化极限学习机(PSO-ELM)端点检测模型。依靠ELM神经网络的快速学习能力,瞬间完成端点检测并输出预测结果。该算法在一定程度上优化了网络连接结构,但是仍然存在一定的缺陷。(2)为了更好的优化ELM神经网络的连接参数,最后采用自适应步长果蝇(FOAMR)算法优化极限学习机,并将优化后算法应用于语音端点判别模型中。在Matlab辅助软件环境中做了大量的仿真实验,通过实验结果可以得出结论,单纯的ELM模型具有最好的快速性和较高的准确率;PSO-ELM模型的准确率有所提升但是训练时间最长;而最终基于自适应果蝇优化ELM模型具有最高的准确率,同时具备了很好的快速性,达到了实际应用的要求。
其他文献
随着汽车电子的飞速发展,智能化的汽车开始进入日常生活。为汽车安装“第三只眼”,有助于提高驾驶者的舒适度和安全性。基于图像处理技术的汽车辅助驾驶系统的研究,已经成为了当
疲劳是人体的一个复杂的生理状态,主要表现为身心疲惫,注意力和工作效率下降。现今社会有很多场合要求精神饱满,如驾驶员疲劳驾驶、高空作业、飞行员高空工作、外科医生手术
汽车产业的飞速发展导致汽车电子技术的要求不断提高。对现代汽车而言,舒适、效率及安全性相当依赖于各类电控系统的应用,因此具有电子控制单元ECU(Electronic Control Unit)的
随着社会的飞速发展以及科学技术的高速进步,企业越来越意识到工业自动化和智能化对企业整体效益的影响力。而AGV小车在自动化生产线中扮演着重要的角色。AGV小车相比有轨穿
单克隆抗体(mAbs)药物是当前国际生物药品市场上的销量最高的药物,其具有巨大的商业价值,但是由于对单抗生产过程反应机理的不确定和生产工艺的不成熟,导致大批量体外生产单
随着工业机器人技术的迅速发展,工业机器人在装备制造业中得到了越来越广泛地应用。在船体外板加工领域,水火弯板成形工艺是目前国内外各大造船企业普遍采用的技术。水火弯板
本文主要研制了一种可随机开窗口的高帧频CMOS相机,并给出了系统的硬件和软件设计方案。在自由空间激光通信系统中,信标光光斑经过空间衰减后,由CMOS相机接收,并通过窗口读出
本文针对目前我国数字化变电站建设中,采用的工业以太网交换机普遍尺寸较大,价格昂贵,维修不便,不利于传统变电站到数字化变电站的过渡等不足,从分析数字化变电站中交换设备的要求
随着电力电子技术的飞速发展,在各领域的应用不断深入。电力电子系统功能和结构日趋复杂化和多样化,对电力电子系统的控制要求也随之提高。以往人们通常采用模拟电路对电力电
逆变技术随着自动控制理论、电力电子技术、电子计算机,微电子等学科的发展已经进入了一个新的时代,其应用也相应地进入了一个新的高潮。大到航空工业,小到磁盘技术,无不有逆变技