基于深度学习的语音端点检测

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:bxinliy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与人、人与机器之间交互最自然的媒介,噪声的干扰不仅会降低语音交互的质量,还会严重影响如语音识别和说话人识别等系统的性能。语音端点检测是让机器在嘈杂的环境中检测语音在某一时刻是否出现的技术,是很多语音信号系统的预处理步骤,具有十分重要的意义。本文介绍了现有端点检测方法的基本原理,对基于深度学习的方法进行了分析和实验,针对其中的问题提出了三个方面的改进:1.提出了基于深度卷积长短时记忆网络的两阶段训练方法。深度卷积长短时记忆网络是端点检测最新的深度学习模型,本文分析其结构特点,将训练过程分为非时序和时序两个阶段,提高了数据的利用率。2.提出了一种以语音增强的自编码为辅助特征的端点检测联合算法。通过分析语音端点检测和语音增强三类联合算法的交互特点,提出一种自编码辅助特征的联合模型,扩展了联合形式,提高了端点检测的性能,并实现了超参数权重的自动调整。3.提出了基于似然比检验的语音端点检测方法的改进算法。对似然比检验算法的基本原理进行了研究,针对参数估计不准和阈值需要人为设定这两个缺陷,设计了融合统计信号处理和深度学习的算法,利用时频掩蔽估计参数,然后利用全局平均池化计算阈值。与传统信号处理的基线方法对比显示,本方法的两个部分能分别提升基线系统的性能;与端到端的深度学习方法对比,在模型规模相当的情况下,该方法具有明显优势。
其他文献
针对华东区域地势差异大的特点,结合当前省级农业气象服务的工作重点,使用VC++语言开发出一套华东区域六省一市使用的农业气象情报微机解译系统。该系统在Windows95/98/NT操作平台上灵活运行,解决了
1996年8月3-5日河北特大暴雨在叶风低压外围停滞的中α-云团产生的、中-α云团在三支气流汇合和共同作用下发生发展;(1)低层偏东风干冷气流,(2)中低层南风暖湿急流,(3)副热带高空急流,中-α云团内的中
在相关普查的基础上,使用最优分割挑选因子,逐步对预报量进行分类,按照业务预报的需求,形成分类预报模式,取得了较好的试报、预报效果。
山东省宁阳县伏山镇苏楼村的农民苏留印是种田能手,并长期在本村从事代理信贷业务。2007年,他发起成立小麦良种种植协会,三年的时间,组织本村农民建立起1000亩的小麦良种繁育基地
新一轮课程改革拉开了帷幕,伴随着《普通高中化学课程标准(2017版)》的颁布,各版本的化学新教科书应运而生。Kano模式起源于美国心理学家赫兹伯格的“激励-保健理论”,逐渐发
通过规划和政策,德国政府引导工业向小城市和镇布局,走出了一条以小城市和镇为主的城市化道路,带动了农村的整体发展。$$美国和德国,一个是北美大国,一个是欧洲强国,虽然资源禀赋、
报纸
这10多年来江苏省代表站的小麦白粉病始病期、严重率和同期的气象资料,采用滑动相关普查方法,分析了气象条件对白粉病发生的影响作用,发现对白粉病始病期和严重率有着显著的影响,但
分析了北京市水资源短缺的现状和降水的气候概况,阐述了实施人工增雨的迫切需求和技术可行性。并对所采用的飞机、气球、高炮和火箭等工具的综合增雨技术所采用的催化剂、作业
利用常规气象资料,雷达、卫星等探测资料分析福建省夏旱期间气候特征和人工增雨潜力,为开展人工增雨提供物理依据。分析结果表明:夏旱期间内地两个旱区人工增水条件优于沿海两个
本文突出介绍了远距离、大面积探雷技术。文中对摄影探雷、雷达探雷和光电传感器等探雷新技术进行阐述,并探讨了上述探雷技术的发展趋势,最后列举了美国正在研制的三种探雷器