论文部分内容阅读
语音通信是一种高效的信息交流方式。在实际环境中,语音信号会受到外界环境的影响,而网络传输会进一步引入干扰。随着移动通信系统的飞速发展,各种通信组织相继推出了和完善了包括变速率语音编码和立体声语音编码等标准。如何获得更好的音质效果,涉及到语音编码、语音增强、解码语音信号的后处理等多个方面。语音的音质通过人的听觉感受来检验,而人的听觉系统是一个复杂的心理、生理和物理的转换过程实现的。在带噪语音中,如何获得纯净语音,提高语音的清晰度和可懂度是研究的重点,涉及的主要研究工作如下:当残留噪声处于听觉掩蔽之下时,噪声的感知会被大大减轻。子空间增强方法首先通过移除噪声子空间,然后通过对加入权重系数的信号子空间的逆变换获得纯净语音。人耳的掩蔽特性是和关键频带相关,并且关键频带是根据人耳耳蜗的特性推理出来的,所以子空间去噪如果需要利用掩蔽性质,需要频率域到特征域的转换。在计算自相关矩阵后,通过特征分解获得特征值和特征向量矩阵。通过功率谱密度计算掩蔽门限值,再利用特征滤波器增益计算线性预测矩阵,反变换后获得增强后的语音。语音的基音和谐波成分有着明显的周期性。相对而言,波峰比波谷对听觉感知的影响重要的多。自适应变速率编码(Adaptive Multi Rate, AMR)按照感知权重最小的标准为线性预测系数搜索激励信号。按照听觉掩蔽理论,人耳对共振峰处的噪声感知相对较不敏感。在开环基音搜索前,输入语音会通过一个感知加权滤波器。系数的调整来控制滤波器的响应。根据能量值,可以粗略判断该帧是否为语音帧。通过设定门限值,使用梳状滤波器强化语音中的周期成分而弱化噪声,能取得较好的去噪效果。当网络传输质量较差时,信道也无法进行差错控制,解码段会接收到错误的帧信号。一般的错误隐藏方法会根据周围正确帧的信号进行插值或者替换重建错误帧。自适应码本的相关性会影响错误帧的恢复速度。当能量较高时,限定其对激励信号的贡献可以减少帧间相关性。当连续收到错误帧时,基音值不是简单自增,而是在一定范围内波动,可以避免偏差值的累计。增益系数的修整也可以在错误帧结束后,尽快恢复正常解码。嵌入式技术的特点非常适合目前终端市场的发展趋势。考虑到嵌入式设备资源的有限性,需要减少应用程序计算的复杂度。在基于ARM的手机平台上,对自适应变速率编码进行了移植和优化。在该语音标准中,代数码本的搜索是一个重要且复杂的环节。在不同的轨道中,包含着对应的脉冲。通过按照加权输入语音与加权重构语音之间的均方误差最小的标准,对不同的位置进行搜索。整个搜索是嵌套进行的,这带来了较大的计算量。可以利用更高效的搜索算法,获得对应的脉冲位置。从而节省了编码时间,提高了编码效率。同时也利用ARM指令和平台的特性进行优化。在保证音质的前提下,大大节省了编码复杂度。该研究对在嵌入式设备上进行多媒体应用的移植是有益的。