论文部分内容阅读
随着网络信息的发展,音频信号越来越多可以从网络中获取,而网络中音频信号都是经过语音压缩编码的。码激励线性预测编码的环境音分类技术研究正是以音频压缩编码的比特信息流为对象,环境音频信息不需要经过解压缩,直接从编码比特信息流中获取音频特征参数,再依据特征参数进行分类模型训练,最终完成环境音频信号的分类。采用该方法可以提高网络传输的环境音频信号的分类率,同时由于是在解码前进行特征提取与分类,提高了识别分类的速度。 论文通过研究压缩音频信号的编码流,采用了基于编码流的特征提取方法,实现了对音频信息的分类。在编码环境音分类上取得以下三方面的研究成果: 第一,提出了新分类特征的生成方法。研究了基于G.723.1语音编码技术,从其编码流中提取语音特征参数,然后对其进行特征参数的复合,最后得到优化的复合特征参数CELP。特征参数的有效性通过实验分类正确率进行验证,并采用多个分类器的进行分类验证了其通用性;实验通过与解码后提取的基于波形的特征参数相比,验证了使用新特征提高了分类正确率。 第二,利用集成学习的方法,设计和实现了多分类器对环境音分类。针对单一分类器存在的不足,研究提出了采用集成学习的方法将两类不同分类器进行集成,构成集成分类器,在weka平台下二次开发实现了集成分类器,实验结果表明集成分类器的分类效果均好于单一分类器的。 第三,采用Tri-Training半监督算法对小训练样本集(10%,20%,40%,60%,80%)的环境音分类,取得了较好的实验结果。 本文研究编码的环境音频数据的特征提取与分类,通过仿真实验表明了新特征CELP优于传统的特征,提出集成学习的分类方法进一步提高了环境音分类正确率,并采用。半监督算法实现了小训练样本下具有良好分类效果。