论文部分内容阅读
在语音通信中,语音编解码器具有重要的作用。语音编解码器识别技术在通信系统分析、通信终端识别、保密通信对抗等领域有着广泛的应用。由于语音编解码器在设计时会综合考虑压缩级别、语音质量和复杂度等,所以不同的编解码器压缩算法不一样,对语音产生的影响也不一样,而这些影响可以在编码后的比特流或编解码后的重构语音中揭露出来。因此本文设计实现了基于接收比特流的识别算法和基于重构语音的识别算法。本文研究了基于接收比特流的识别算法。在特征参数的选取阶段,统计了编码端识别算法中经常使用且利用现有的工具可以计算的一些特征。分为三组,第一组包括自相关系数、中心二阶矩、傅里叶变换、二进制比,段长20kbits。第二组包括均值、自相关系数、二三四阶中心距、二进制比,段长8kbits。第三组包括均值、方差、自相关前20个系数、熵、峰度、偏度、频域4个子带的均值、方差、偏度,段长1KB。使用顺序浮动前向搜索方法对三组中不同的特征组合进行了实验,通过对实验结果进行分析,最终确定了最佳特征参数组合。算法实现阶段,先对编码比特流进行预处理,形成字节段和比特段,段长为20kbits。然后提取字节段的二三四阶中心距、均值、方差、傅里叶变换值和比特段的二进制比作为特征参数,使用纠错编码支持向量机作为分类器。使用TIMIT语音库的语音作为实验数据,进行算法仿真实现,实验结果为对于GSM-HR、GSM-FR、GSM-EFR、AMR4.75、AMR7.95和G.729可以100%正确识别。因为G.723.153和G.723.163的压缩算法相似,速率也比较接近,所以在识别的时候难以区分。本文还研究了基于重构语音的识别算法。在特征参数的选取阶段,与传统方法选取一类特征参数不同,本文算法考虑对多种特征进行组合,克服单一特征对识别算法造成的不利影响。分两组进行了实验,第一组对MFCC静态特征、一阶差分、二阶差分、能量、能量一阶差分、能量二阶差分的所有排列组合进行了实验。第二组对MFCC静态特征、均值、自相关系数、二三四阶中心距、傅里叶变换、方差、幅度直方图的排列组合进行了实验。通过对实验结果进行分析,最终确定了最佳特征参数组合。分类器选择神经网络,通过改变网络的参数设置,进行了8组实验,确定了最终的网络参数设置。算法实现阶段,先对重构语音进行预处理,形成帧信号,帧长32ms,然后提取帧信号的MFCC、二阶差分、帧能量一阶差分、自相关系数、傅里叶变换和方差的组合作为特征参数,使用三层的BPNN作为分类器。TIMIT语音库作为实验数据,进行算法仿真实现,实验结果为对GSM-HR、GSM-FR、GSM-EFR可以100%正确识别,对G.729编码器识别精度为82.5%。