基于计算听觉场景分析的混合语音信号分离算法研究

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:ybingh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算听觉场景分析(CASA)是现代语音信号处理研究领域中的一个新兴课题。在自然环境下,来自于多个声音源的混合语音信号形成了一个典型的听觉场景,基于听觉场景分析(ASA)可以从复杂声学环境中分离出目标语音,分离效果比较理想,但是随着人机交互学、自动语音识别(ASR)、助听器设计等研究的需要,噪声环境下的语音分离算法仍然存在较大的挑战。本文主要针对计算听觉场景分析(CASA)分离混合语音信号的问题进行研究,归纳和分析了当前基于CASA的语音分离算法和声音、噪声的一些特性,重点研究了基于信号能量的混合语音分离算法和基于信号起始时刻和截止时刻的语音分离算法,具体工作和创新如下:人耳听觉系统对于语音信号高低频的处理机制不一样,而且混合语音信号在高频段的能量较低,容易受到噪声的干扰,根据这一特性,提出基于信号能量的混合语音分离算法,在听觉分割之前先计算信号的能量值,由于高频部分能量较低,因此,根据能量比值去除掉信号高频部分有可能来自噪声的那些时频(T-F)单元。这样,听觉重组之后的目标语音信号将更少的受到噪声干扰,使得分离结果更有效。对于不同声音源的信号,几乎不可能具有相同的开始时刻和截止时刻,因此,基于这一声音线索,也可以完成混合语音信号的分离。本文采用一种准确的包络提取算法提取信号的开始时刻点onset和截止时刻点offset,然后进行包络平滑,对候选的起止和截止时刻点进行检测和组合,得到听觉片段,最终根据二值模知识分离出目标语音信号。本文在Win7平台Visual C++6.0开发环境下,选用Cookie数据集进行仿真实验,并对实验结果进行了性能评估,验证了所提算法的有效性和可行性。
其他文献
当前,随着计算机硬件及多媒体技术的发展,图像处理在人们的日常生活中起了巨大作用。而在这当中,又以彩色图像处理算法对人们有着最直接的影响。所以,针对彩色图像开发的各种算法
NGN作为下一代网络,可以提供包括语音、视频和数据等多媒体业务。VoIP作为下一代网络的多媒体通信技术,将互联网功能与PSTN功能结合在一起,可以承载话音服务及其他带会话的应用
良性的前列腺增生简称为前列腺肥大,是老年的男性患者非常常见的疾病病之一,以尿意频繁、排尿费力和尿液潴留为主要的临床表现形式,疾病发展较重的可以发展为肾功能不全,甚至
在视频压缩技术领域,以最新的视频压缩国际标准H.264/AVC和我国具有自主知识产权的AVS(AudioVideoCodingStandard)编码效率更高,但是随之而来的就是硬件实现复杂度的大大增加,所
随着人们对无线通信需求的不断增加,无线宽带接入技术得到了不断发展。IEEE802.16系列标准是针对固定和移动用户而产生的无线宽带接入技术。它被广泛应用于“最后一公里”的无
随着计算机通信网的迅速发展,数字签名已在信息安全、身份认证、数据完整性、不可否认性与匿名性等方面发挥了重要作用。群签名作为一种特殊的数字签名,可以广泛地应用于电子选
移动软交换的概念来自于 3GPP R4 的规范。移动软交换主要针对核心网络的交换部分,不涉及到接入网络的改造,其核心概念是实现了控制面与用户面的分离。所有的控制功能集中在 MS
随着通信网络技术的高速发展,当前的网络接入存在着最后一公里接入的瓶颈问题。电力线通信(PLC)作为一项新的解决最后一公里接入的技术,它有着其独特的优点,如电力线的覆盖范围
本论文对心电信号的预处理、波形分析、参数计算、自动诊断等,作了较详细的研究,并在此基础上实现了一套较完整的、具有实际运用价值的心电工作站的软件系统。首先本论文对心
在认知无线电网络中,认知用户能够通过持续不断地对自身所处的无线环境中的信道使用状态进行感知,寻找机会接入可用频谱空穴,但是在利用频谱空穴的同时要不断地检测频段内是否有