论文部分内容阅读
声学事件是指一段单一完整的能够引起人们感知注意的连续声音信号,声学事件检测是指分析待检测声音信号的音频特征从而识别其中包含的特定声学事件。与传统的声学事件检测任务相比,行车噪声环境具有特殊性:其属于开放噪声环境,其主要成分风噪是一种空气动力性噪声,与车辆、风速、车速等因素相关,而这些因素中大部分既复杂多变又不可预知;此外,行车环境下的声学事件检测对实时性有非常高的要求,过大的延时可能会带来灾难性的后果;而且,要处理的声学事件大部分与人类的行车决策行为有关,所以系统的检测结果应与人类的主观判别结果保持高度一致。
面向行车环境的特殊性,本文对行车噪声环境下的快速声学事件检测方法展开研究。具体研究内容如下:
第一,为了有效去除声音信号中的噪声成分,从而获取较纯净的声音信号,本文对噪声进行建模,然后用谱减法进行去噪。具体的研究内容包括,采用互信息分析噪声低频域与噪声高频域的相关性;用噪声的低频域作为输入向量,高频域作为输出向量,用径向基函数神经网络为噪声建模;估计出噪声的高频域噪声后,用谱减法去噪,获取较纯净的声音信号。
第二,为了接近人耳的判别效果,使无人车趋于人性化,本文提出了基于等响度曲线A计权滤波器的声学事件检测方法。人耳对相同强度不同频率的声音变化的敏感程度不同,本文利用此特点,用基于人耳等响度曲线的A计权滤波器对声音信号进行加权,使声音信号映射到真实的人耳听觉领域。
第三,为了实现算法的实时性,本文根据行车环境下的目标声学事件在语谱图上的基频变化轨迹清晰可辨的特点,提出获取声音信号基频变化轨迹特征的方法。具体步骤包括:二值化目标声学事件语谱图;用目标声学事件二值语谱图对声音信号中要保留的频带进行定位;提取其中最主要的频率成分。这种方法与基于全频域的梅尔倒谱系数特征方法相比较,降低计算量,从而能够有效提高检测速度。
本文采用C++实现了系统的实现工作,并进行了实验测试。实验结果表明,系统达到预期检测率,在鲁棒性和实时性方面有很好的效果。
面向行车环境的特殊性,本文对行车噪声环境下的快速声学事件检测方法展开研究。具体研究内容如下:
第一,为了有效去除声音信号中的噪声成分,从而获取较纯净的声音信号,本文对噪声进行建模,然后用谱减法进行去噪。具体的研究内容包括,采用互信息分析噪声低频域与噪声高频域的相关性;用噪声的低频域作为输入向量,高频域作为输出向量,用径向基函数神经网络为噪声建模;估计出噪声的高频域噪声后,用谱减法去噪,获取较纯净的声音信号。
第二,为了接近人耳的判别效果,使无人车趋于人性化,本文提出了基于等响度曲线A计权滤波器的声学事件检测方法。人耳对相同强度不同频率的声音变化的敏感程度不同,本文利用此特点,用基于人耳等响度曲线的A计权滤波器对声音信号进行加权,使声音信号映射到真实的人耳听觉领域。
第三,为了实现算法的实时性,本文根据行车环境下的目标声学事件在语谱图上的基频变化轨迹清晰可辨的特点,提出获取声音信号基频变化轨迹特征的方法。具体步骤包括:二值化目标声学事件语谱图;用目标声学事件二值语谱图对声音信号中要保留的频带进行定位;提取其中最主要的频率成分。这种方法与基于全频域的梅尔倒谱系数特征方法相比较,降低计算量,从而能够有效提高检测速度。
本文采用C++实现了系统的实现工作,并进行了实验测试。实验结果表明,系统达到预期检测率,在鲁棒性和实时性方面有很好的效果。