论文部分内容阅读
声学事件是指在既定的环境下,人类能够区分和理解的具有完整含义的一段连续的声音信号。声学事件检测是指在声音信号中依据声音信号的声学特性检测是否包含特定声学事件的过程,一般基于声学事件的分类算法实现。本课题中声学事件检测任务的声学环境与常见的检测环境有所不同,其主要受到行车噪声的影响,噪声主要来自风噪和发动机的振动等。其中发动机的振动噪声持续存在,而在行驶过程中由车辆与气流摩擦产生的风噪则具有复杂多变的特点。并且,由于车辆是一个密闭的环境,各种噪声会在车辆内部形成混响,这为行车噪声环境下的声学事件检测任务带来了很大的难度。此外,声学事件检测系统只有及时、快速地检测到目标声学事件,才能保证为智能决策系统提供有效的声音感知信息,过大的时延反而会影响无人车的正常行驶,最终导致事故的发生。针对行车噪声与目标声学事件的频谱特点,本文以车内噪声环境为背景噪声,以实现快速、准确的声学事件检测方法作为论文的主要内容和工作。具体研究内容如下:第一,为了尽可能的从声音信号中去除噪声成分,从而获得纯净的声音信号,本文对车内噪声进行预测,然后用谱减法进行降噪处理。具体的研究内容包括:使用马尔科夫链对车内噪声状态的变化进行建模,然后使用对车内噪声进行小波分析后,使用线性预测系数预测声学事件的声音信号中的噪声成分,然后使用小波子带谱减法降噪,从而将噪声尽可能的从声学事件中去除。第二,为了尽可能的减小噪声对声学事件检测的影响,提高声学特征对噪声的鲁棒性,本文提出了基于人耳频率选择特性的鲁棒性特征提取算法。人耳对不同频率下的振动峰值较为敏感,通过对不同频率振动峰值的感知与频率增益,从而减弱噪声对听觉感知的影响。本文仿真人耳对频率的感知与选择性增益的特性,利用共振峰的信息对梅尔滤波器组进行加权,提取对噪声鲁棒的声学特征。第三,为了实现声学事件的快速检测并提高声学事件检测的准确率和降低误识率,本文首先在行车噪声环境下测试了采用传统的单核核函数支持向量机(Support Vector Machine,SVM)方法和多核核函数SVM方法进行声学事件分类的性能,分析它们在本课题应用中的不足;从而引入多尺度RBF核函数构造基础核函数集,提出一种多尺度多核径向基(Radial Basis Function,RBF)的SVM分类器训练算法。该方法不但能够解决单核核函数映射能力的不足的问题,而且能够有效减少传统多核SVM算法的训练时间,提高准确率并降低误识率;同时该方法获得的多尺度RBF混合核函数比单核核函数的声学事件检测速度更快,实现了声学事件的快速检测的任务。本文采用C++实现了声学事件检测系统和各算法的开发工作,并在无人驾驶汽车上进行了实际行车噪声环境下的性能测试。实验结果表明,系统达到预期对声学事件检测准确率和误识率的要求,同时提高了声学事件检测的速度、满足快速声学事件检测对时延的要求,并且该系统在噪声鲁棒性方面有很好的表现。