数字音频被动取证关键技术研究

来源 :宁波大学 | 被引量 : 2次 | 上传用户:zxcvzo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字音频是人们日常生活中最容易获得数字媒体之一。除了以购买、下载的方式获得音频文件外,还可以通过实时录制的方式生成音频/语音文件。然而,音频编辑和处理软件的不断发展和完善,使得对音频的编辑和修改变得更加简单和廉价。同时,人耳也很难察觉这种修改留下的痕迹。因此,如何有效验证数字音频的原始性、完整性和真实性,就成为了数字音频被动取证技术迫切需要解决的问题。本文对数字音频被动取证中的关键问题和技术进行研究和探索,主要在取证音频数据库构建、音频来源取证、音频压缩历史检测、音频内容篡改检测及音频隐写分析这五个方面开展了研究工作:1.针对目前数字音频取证领域基准音频/语音库缺乏的问题,本文分别以CD音频抓轨和现场语音录制的方式,构建了一个基础音频数据库(CKC-AD)和一个基础语音数据库(CKC-SD)。前者包含2种类型,以及超过5种时长、10种音乐流派、4种语言的音频文件,共11172个;后者使用38种不同型号录音设备、对31个(21男10女)说话人分别录制了朗读和口语两部分语音。另外,本文在CKC-SD的基础上,依据具体研究内容,进一步构建了TIMIT翻录语音库、二次翻录音频库和设备本底噪声数据库。2.本文音频来源取证方面的工作由二次翻录音频检测和录音来源设备识别两部分组成:针对目前二次翻录音频检测方法仅涉及单一偷录或回放设备的问题,本文深入分析了音频回放翻录过程中不同偷录和回放设备对二次翻录音频的影响,并根据二次翻录音频和原始录制音频在高频信息量分布上的差异构建了特征向量。实验结果表明,该方法能有效区分原始录制音频和二次翻录音频,综合分类准确率达到了98.47%。另外,将该方法集成到GMM-UBM说话人识别系统中,可大幅提高其抵抗音频回放攻击的能力,使其等错误概率(EER)降低了47.06%。针对目前大多数录音来源设备识别方法均是基于美尔倒谱系数(MFCC)特征或其他声学特征的思路,本文从录音设备本身的特性切入,提出了两种录音来源识别的方法。方法一是利用不同型号设备在音频编码过程中对各编码参数使用特点的不同,构建相关的统计量特征实现录音来源设备的识别。实验结果表明,该方法对CKC-SD中10款录制MP3音频设备的平均识别率为99.97%,对14款录制AAC/M4A音频设备的平均正确检测率为96.53%。另一个方法对方法一受录音格式限制的局限性进行了改进。在深入研究不同录音设备本底噪声的基础上,提出了设备本底噪声的估计方法,并针对估计的本底噪声构建了频谱形状特征和频谱分布特征来表征各设备。该方法实现了对CKC-SD库中34款设备较为准确的区分,其平均分类准确率为95.53%。3.针对目前涉及较少的AAC音频双压缩检测,本文提出了一种基于Huffman码表索引的双压缩检测方法。通过分析双压缩操作对码表索引分布的改变,统计了码表索引的直方图和Markov单步转移概率作为分类特征。对低转高码率的双压缩音频(FAAC/FAAD2编解码器),检测准确率达到了99%以上;但在相同码率情况下,分类准确率仅为79.56%。与该领域典型方法的对比结果表明,本方法整体上检测准确更高。另外,对MP3音频的压缩历史检测(不超过3次)和码率估计进行了探索,本文研究了Huffman码表索引和比例因子在多次压缩情况下的渐进式变化,有针对性地构建了均差、概率分布和互相关性统计量组成特征向量。实验结果表明:本方法对双压缩MP3音频的检测准确率较目前该领域的几种典型方法,整体上有所提升;在三次压缩检测方面,对低转高、相同码率及高转低码率的情况(前提条件:BR2=BR3),分类准确率分别为97.73%、94.56%和80.28%,另外,在第三次码率高于128kbps时,能较为有效地从一、二、三次压缩音频混合集中区分三者。4.针对常见的篡改操作,本文提出了两种篡改定位的方法。方法一受帧偏移方法的启发,利用篡改前后音频量化特性的不一致性,将量化前后小值频率系数的转化率作为检测变量实现篡改定位。实验结果表明,该方法对192kbps(原始未篡改MP3音频的码率)及以下音频的篡改定位准确率达到了98%。但该方法仅对篡改后以非压缩格式保存的音频有效。方法二基于重压缩对帧结构被破坏部分的音频具有校正功能的原理,发现了篡改前后的音频片段在估计的压缩次数上的不一致性,从而将这种不一致性用于篡改定位。虽然从实验结果来看,由于受限于双压缩检测方法的精度,该方法的定位准确率暂无法令人满意,但为研究压缩音频的篡改检测开辟了一种新的思路。另外,该方法实用性更强,可检测篡改后的双压缩音频。5.针对MP3Stego低嵌入率情况下检测准确率不高的问题,通过分析MP3Stego隐写操作对MP3音频量化频谱系数的影响,有针对性地对量化频谱系数幅值的差值构建了块内和块间的Markov单步转移概率特征,实现了对低嵌入率下MP3Stego的有效检测。实验结果表明,该方法对嵌入强度为10.6%的MP3音频,平均检测准确率能达到90.74%。随着码率的降低,检测性能会有所下降,但仍优于现有的典型方法。另一方面,本文还对另一个MP3隐写工具——Under MP3Cover的隐写原理进行了深入剖析,发现其嵌入方法的核心是连续的LSB替换,但嵌入的位置间隔是通过参数Bit Spacing控制。依据其隐写原理,对RS分析法进行了改进,成功实现了对Under MP3Cover的检测,并能有效估计嵌入秘密信息的长度。另外,对改进方法中最佳翻转算子的选择、是否重叠分组以及参数Bit Spacing对嵌入强度估计准确性的影响等问题进行了讨论与分析。
其他文献
网络科学是当前研究现实世界事物之间关系的有力工具之一。将复杂系统建模为复杂网络是进一步分析和研究现实世界对象之间关系的前提,其中点表示复杂系统中的对象,边表示对象
目的:了解医院手术业务流程现况问题,为制定科学、有效的流程优化与改进方案提供理论支撑。方法:通过问卷调查及选取60名手术患者实施全流程追踪,运用精益生产的管理工具系统
传统的基于角色的访问控制(Role-Based Access Control,RBAC)模型具有策略无关、自管理和便于实施信息系统安全策略的优点,但RBAC模型仍存在一些潜在的安全缺陷和冲突,比如RB
多样化的数字视频信息给人们的生活和工作带来不少方便和乐趣,然而不乏心怀叵测之人为达到切身利益,采用视频编辑软件对视频文件肆意修改,带来了信息安全上的诸多问题。因此
随着技术的发展,公路施工技术也在不断得到完善。其中公路路基施工是公路整体施工的基础组成部分,在路基施工过程中,需要使用振冲碎石桩施工技术。作为地基的处理方法之一的
目的观察围术期小剂量艾司洛尔持续静脉滴注对老年患者心肌肌钙蛋白I(cTnI)表达的影响。方法择期行胃、肠道手术的老年患者120例,年龄60~75岁,随机分为艾司洛尔组和对照组,每组6
2018年5月15日上午,“山东女子学院大学生艺术团成立暨山东省艺术研究院非遗传承研究基地揭牌仪式”在学校图书馆隆重举行.山东省文化厅二级巡视员刘敏,山东省艺术研究院院长