论文部分内容阅读
随着信息技术,网络技术以及多媒体处理技术的飞速发展,语音作为最便捷的多媒体形式之一,在人类交流中发挥了越来越重要的作用。语音信息的真实性、完整性关乎到各个领域,大到国家安全、社会稳定、法庭取证,小到公民个人利益。然而,无线网络以及通信信道的开放性,使不法分子对语音数据的窃听、篡改等成为可能,对语音数据的修改、传播更加方便。因此,语音的安全认证显得尤为重要。语音认证有其特殊性,语音信息与音乐在信号特点、编码、传输方式以及存储方面有很大的不同。尽管现有语音通信终端的资源有限,语音对实时性的要求却很高,故语音认证对算法的效率要求更高。而现有的语音内容认证算法研究中,主要对象为原始语音,计算量大,很容易遭到编码的影响。针对上述问题,本文致力于保护语音内容的真实性与完整性,基于感知哈希主要研究高效的语音内容认证算法。感知哈希不光对内容保持操作具有很好的鲁棒性,而且对非法的内容改变具有不错的区分性,也满足单向性、抗碰撞性等安全性要求,已逐渐被用来解决多媒体的认证问题。针对现有语音内容认证算法效率低,认证粒度无法满足定位精度,不能在资源有限的语音通信终端实时应用的现状,本文提出了一种可实现篡改定位的高效语音内容认证算法。该算法提取线谱对(LSP)系数为特征,通过系数加权的哈希构造方法减小认证数据量,实现了对语音内容的快速认证。实验结果表明:该算法对减小音量、回声、重采样、提高音量等内容保持操作具有鲁棒性,对替换、删除等恶意操作敏感,并可实现精确的篡改定位。为了快速验证压缩域语音内容完整性,结合人耳听觉感知特性,本文提出了一种基于MFCC的压缩域语音感知哈希内容认证算法。该算法由压缩域MDCT系数计算MFCC特征参数,经哈希构造得到二进制感知哈希值。实验结果表明:该算法较原始语音为输入的内容认证算法鲁棒性和区分性相似,具有更低的数据率,并可实现篡改定位,特别适用于无线通信等资源受限的情况。