晚期混响抑制技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yangfanyuanhang1020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
房间混响是在封闭空间内进行语音通信时,语音信号从声源到达传声器的多径反射所造成的,其中到达传声器较晚的反射波称作晚期混响,晚期混响会对语音造成自掩蔽和重叠掩蔽效应,因而影响语音的可懂度。为了消除晚期混响给语音带来的影响,语音去混响技术应运而生,并在近年来得到了广泛研究与应用。然而目前存在的去混响方法都不能十分精确地估计混响,导致处理后的语音通常会带有一定程度的谱失真,造成语音不连续、语音起始端丢失、“音乐噪声”残留等问题。针对这些问题,本文展开了深入的研究,寻求解决这些问题的有效方法。本文的主要研究内容和创新点包括以下三个方面:  1)提出了一种奖惩因子修正的统计模型法,将基于房间冲激响应模型的晚期混响谱方差估计用奖惩因子进行合理的约束,有效地保留了处理语音的大多数语音起始位置,消除了处理语音音节的不连续。  2)提出了一种新的基于线性预测分析的预白化技术,修正了长时多级线性预测去混响算法,有效提升了处理语音中隐藏的第一、二共振峰,从而恢复了语音的低频信息。  3)提出了一种基于人耳听觉特性的去混响算法,有效地解决了噪声环境下的处理语音中“音乐噪声”残留的问题,提高了处理语音的听觉舒适度。
其他文献
DSP作为通用的数字信号处理器,在通信、数值运算、图像处理等诸多领域有着广泛应用,其强大的数据运算能力特别适合运算密集的应用场合。现代社会对DSP的应用越来越广泛,对新DSP
X光位置测量对于要求高品质、高稳定性的同步辐射光源具有重要的作用,它是同步辐射装置向广大用户提供可稳定使用光束的必不可少的条件之一,其测量值还是实验用户需要及时了解
交通场景理解是成功实现自动驾驶和车辆导航等应用的关键技术之一。研究视觉系统在处理交通场景信息时的关注特性、视觉敏感度、感知及快速解读能力,对交通场景理解具有重大
信息中心网络作为一种革命性的网络体系结构,它将传统的面向主机的端到端通信模式转变为以内容为中心的通信模式。作为一个崭新的概念,信息中心网络带给网络的革命性改变引人关
最近几年,由于人群计数在智能监控和安防领域广泛的应用价值和社会意义,使得单张图像和监控视频中的人群计数问题在学术界和工业界受到了越来越多的关注。但是,在现实场景中,严重
自动说话人识别技术,简单来说就是根据语音对说话人进行自动区分,从而进行说话人身份鉴别与认证的技术。该技术在国家安全方面一直有着重要的意义。另外,随着通信以及互联网技术
声载波通信是使用声波作为数据传输载体的新型无线通信技术,与传统的电磁波通信及光通信手段相比,该方法不受电磁干扰和光照明暗制约,且能以特定方式无损穿透金属障碍物,具有重要
水声通信网络被广泛地应用在海洋资源勘探、海洋环境监测、水下目标跟踪和定位、军事侦察、灾难预警等领域,因此,水声通信网具有重要的研究意义。然而,水声信道具有带宽有限、传
社会网络的研究日渐被各个领域研究者所关注和重视,生活的网络化使该研究成为了一个热点。其中包含社会网络中核心节点的识别、局部网络社团的发现以及全局网络划分等都成为了
由于声波是水下通信的主要传输媒介,随着人类在海洋中的活动越来越频繁,水下传递信息的需求越来越多,水声通信技术的应用也越来越广泛。这些需求也使得水声通信的速率和可靠性的