论文部分内容阅读
便携式录音设备的普及使得数字音频资料的获取越来越方便,同时各种功能强大的多媒体编辑软件的出现也使得音频的编辑和修改越来越容易。若这些被篡改的音频作为电子证据用于法庭等重要场合,将引起严重的社会问题。因此,通过数字音频篡改检测技术验证数字音频数据的可靠性有重要意义,在司法取证和新闻信息真伪鉴定等领域有着广泛的应用前景。数字音频篡改方式可分为语义篡改和属性篡改,本文的研究重点是数字音频语义篡改检测。针对两种典型的数字音频篡改方式,同段音频复制粘贴篡改和异源音频拼接篡改,分别提出一种检测算法。主要工作如下:1、针对同段音频复制粘贴篡改和异源音频拼接篡改,分别总结相应的检测流程。详细介绍并仿真了两篇文章中的算法并分析实验结果,同时指出算法的不足。2、针对同段音频复制粘贴篡改,提出了一种基于动态时间规整(Dynamic Time Warping,DTW)算法的检测方法。首先利用基频检测算法提取待测音频中各个字节的基频序列,然后通过DTW算法计算两两字节基频序列的匹配距离,最后与设定的阈值进行对比,确定待测音频是否存在复制粘贴篡改。另外,本文自建了中文语音数据库,包括男女录音人员分别用不同手机在四种录音环境中录制,用于构建篡改语音库。实验表明,在噪声条件下,该算法与同类算法相比有更好的检测性能。3、针对异源音频拼接篡改,提出了一种基于静音段的检测方法。首先提取表征录音设备信息的梅尔倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC),并通过广义线性区分性序列核函数(Generalized Linear Discriminative Sequence kernel,GLDS-kernel)扩展为超向量特征,然后利用滑动窗口计算相邻音频特征的相关系数,最后通过判断相关系数是否出现异常确定篡改的存在,并定位具体的篡改区域。实验表明,该算法能有效地检测并定位篡改,对加噪、重采样和压缩具有一定鲁棒性。