论文部分内容阅读
随着互联网技术的飞速发展,通过网络交流已成为人们沟通的主流形式。音频以其使用简单、获取容易等特点,成为主要的沟通媒介之一。但是音频编辑软件的出现对音频文件的安全应用造成了严重的威胁。使用音频编辑软件可以轻易地篡改音频内容,例如插入、删除,对说话人声音进行变调甚至变声等等,被篡改的音频越来越难以通过人耳进行分辨。针对这类问题,伪造音频盲检测技术被许多学者进行了研究和改进。伪造音频盲检测又被称为音频被动取证技术,区别于音频主动取证技术,盲检测技术完全依靠接收端的信息,不需预先嵌入信息即可完成对伪造音频的检测,从而有效的保证音频文件的真实性和完整性。语音信号作为一种音频信号有着广泛的应用,如军事语音指令、网络语音订单、法庭语音证据等。伪造语音盲检测技术也具有很高的实际应用价值,在近年来逐渐受到广大学者的关注。本文针对音频编辑软件篡改语音,提出了两个伪造语音盲检测算法,分别针对变调语音以及变声器变声语音进行算法设计,主要工作如下:1)提出了一个基于类耳蜗系数的音调篡改检测算法。算法结合语音信号增强技术和类耳蜗系数,实现了对音调篡改的检测。提出的算法简单介绍如下:首先,算法将语音通过最小均方误差(Least Mean Square,LMS)滤波器进行预处理,然后提取类耳蜗系数并对其进行多分辨率化,进而构造LMS-MRCG(Least Mean Square-Multi Resolution Cochleagram)特征。检测时使用背景通用模型(Universal Background Model,UBM)作为分类器进行检测。实验结果表明,该算法能够有效地检测变调语音并能准确分类变调类型,无噪情况下检测率可达97.50%。同时,算法具有较好的抗噪能力,在有噪声情况下(特别是在低信噪比环境下)仍可保持85.83%以上的检测率。2)提出了一个针对变声器变声语音检测算法。变声语音与单纯的变调相比可变因素较多,并且更为逼真。在提出的算法中,首先对语音使用基于倒谱法的端点检测实现有话段与无话段的区分,然后针对有话段语音进行特征提取。在特征提取中,算法选择结合基音频率与耳蜗模拟模型生成的GF(Gammatone Feature)特征,并与一阶差分GF与二阶差分GF构成组合特征,其中检测分类器选择高斯混合模型(Gaussian Mixture Model,GMM)。实验结果表明,该算法对变声器变声语音整体检测率可达98.33%,单个变声类型的检测率在有噪声情况下也可保持87.80%以上,因此提出的算法是一种有效的变声语音检测算法。