语音信号中敲击按键声音的检测和抑制

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:Kimyueyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在近几十年来,使用电脑和笔记本电脑在不同的通信场景中录制音频已经有了显著增加,如讲座、会议、视频会议和互联网协议语音通信。一些人使用电脑和笔记本采集讲座音频用于存档,另一些人使用录音机来存档。由于键盘靠近麦克风,导致录制的语音被加性键盘敲击声严重破坏,这些噪声主要来自于机器键盘的打字声。由于敲击声的不平稳性和陡峭性,因此这是一个在单通道语音增强领域具有挑战性的问题。本文主要是抑制语音信号中的键盘敲击声。提出了两种新颖的用于检测和抑制冲击性键盘敲击声的两步算法,即基于相关技术的稀疏非负矩阵分解(SNMF-CR)和基于阈值技术的稀疏非负矩阵分解(SNMF-TT)。在这两种方法中,第一步都是用稀疏非负矩阵分解完成的。在第二步中提出了两种新的算法。在SNMF-CR中,从第一步中(SNMF阶段)估计得到的干净语音与原始带噪语音之间做相关。根据原始带噪语音中的噪声损坏段与估计干净语音中的噪声抑制段之间的低相关系数,原始带噪语音中的噪声段被来自第一步估计的干净语音中的相应噪声抑制段替换。在基于阈值的技术中,根据敲击声的能量比普通语音的频率轴分布更广泛的特点,将整个频谱图水平分为上下两部分。将高频能量的范数除以低频能量的范数,得到的比率跟门限比较从而用于检测键盘敲击声。在原始带噪语音中检测到的键盘敲击声片段被相应的由第一步估计的干净语音片段替代。因此,这两种方法中,没有被键盘敲击声破坏的语音段都被保留不变。在带噪的语音段,键盘噪声被抑制了但是语音质量并未下降。因此抑制敲击声后没有带来严重的语音失真,这是本论文的创新点。提出的算法主要和谱减法、增强的OM-LSA算法对比,所提出的算法具有更好的性能。
其他文献
近几年,随着云计算和物联网等技术迅速发展,结合我国制造业目前存在的高能低效,利用工业资源不合理等问题,将这些前沿的信息理论运用在制造业中,提出了云制造(Cloud Manufact
被动雷达是使用空间环境中已有的军用或民用设备发射的信号而自身不发射信号的雷达系统。被动雷达系统通常由监督通道和参考通道两部分构成,监督通道用来接收目标反射信号,参
近年来,随着软实时技术的快速发展,以多媒体为主导的便携式设备,如:智能手机、平板电脑、itouch等,在人们的生活中越来越变得重要。而各种新功能的需求以及芯片的发展,对以电
近年来,嵌入式视频监控的广泛普及对社会各行各业的安全防范起到了不可或缺的作用。随着对监控需求的增加,有线嵌入式监控系统布控范围受到局限,不能满足特殊监控场合的弊病
随着互联网的兴起与日益激增的数据处理需求,云计算以其低廉的成本,强大的运算存储能力与高可靠性等众多优良特性逐渐受到各大IT企业的重视。MapReduce是云架构的编程模型,用以
图像配准是对取自不同时间、不同传感器或不同视角的同一场景中的两幅或多幅图像匹配的过程。它被广泛的应用于计算机视觉、模式识别、遥感图像处理、医学图像处理等诸多领域
说话人识别是根据说话人语音中包含的个性特征来完成对说话人身份的辨认或者确认。说话人识别因其特有的优势受到了人们的广泛关注,经过多年的研究与探讨,已经出现了很多比较
波达方向(DOA)估计是阵列信号处理的一个重要研究分支,由于其在雷达、通信、声呐、会议系统等多种领域的广泛应用,使得波达方向估计在过去的半个多世纪有着快速的发展。在现