基于设备源信息的数字语音取证技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:bravehearterdoctor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字音频盲取证作为数字多媒体取证的重要组成部分,近年来日益受到关注,而现实中数字音频取证更多的是以数字语音取证的形式出现。目前在数字多媒体取证领域,基于设备源信息的数字图像取证已经得到了充分的发展,相对来说,基于录音设备源信息的数字音频取证的研究还处于起步阶段,有待进一步的发展。因此,本文以基于设备源信息的数字语音盲取证作为研究对象,从以下几个方面开展了工作并做出贡献。1)录制了一个包含15个手机单元的手机音库,称之为SCUTPHONE。同时还构建了一个含有4类录音设备22个录音设备单元的多类型设备音库。上述两个音库中男女声数量相等,每个录音设备单元包含240句语音录音,每句录音近似3秒长。同时,针对数字音频取证领域新近出现的基于语音录音的手机辨认问题,提出了一种基于高斯混合模型-通用背景模型(GMM-UBM)的手机源辨认系统。MFCCs被用来作为表征录音设备单元的特征,在一个手机音库上取得了比基于VQ和线性SVM的系统更高的辨认正确率。此外,还比较了MFCCs特征以及新近提出的含有去噪功能的幂归一化倒谱系数(Power-Normalized Cespstral Coefficients,PNCCs)特征对手机源辨认的性能,并探索性地研究了PNCCs特征提取过程中的各项处理对性能的影响。2)针对目前录音设备源识别的研究主要集中于设备源辨认问题而几乎没有针对设备源确认问题的现状,同时受到基于稀疏表示的分类(Sparse Representation-based Classification,SRC)的强大分类能力的激励,提出了一种新的基于稀疏表示的录音设备源确认框架。在提出了基于样本字典和无监督学习字典(具体为K-SVD)的相应方法后,又利用字典学习领域后续出现的区分性字典学习同时考虑表示能力和区分能力的特点,提出了一种新的基于区分性K-SVD(Discriminative K-SVD,D-KSVD)的设备源确认方法。整个过程分为两个阶段,首先对每一个录音设备训练一个D-KSVD字典,并将训练得到的参数(包括字典和线性分类器)来作为这个设备的模型,在第二个阶段,给定一个语音录音和所声称的录音设备,基于之前训练好的模型来进行设备源确认,提出利用线性分类器的输出来作为评分度量。实验表明新提出的基于D-KSVD的系统较其他两种基于稀疏表示的确认系统以及两种基线系统取得了最好的性能。3)在基于录音设备源的数字语音取证中,有时候录音设备是不可得的,能获取到的可能仅仅有语音录音样本。为此,本文定义和提出了一个在数字语音取证领域有现实意义的新问题:基于语音录音的设备源匹配问题,同时提出了一种新的基于稀疏表示和马氏距离度量学习KISS metric的录音设备源匹配方案:首先对待匹配的两段语音录音中的每一段都提取表征设备特征的高斯超向量,然后利用稀疏表示的区分能力基于高斯超向量进一步提取设备特征,接着对两个设备特征基于正则平滑的KISS metric(Regularized Smoothing KISS metric,RS-KISS metric)进行相似度匹配并与预先设定的门限值相比较做出其是否来自同一个录音设备的判决。实验证明了该方案的有效性。4)通过对录音设备的内部信号处理过程进行分析,发现在录音过程中,传声器、传输电路和A/D转换器都在语音录音中留下了其固有噪声的痕迹,称其为录音设备噪声并提出了一种新的基于录音设备噪声的录音设备指纹。具体来说,对每个待处理的录音设备,为获取其录音设备噪声,利用噪声估计算法来对该设备的多段语音录音进行噪声谱估计然后取平均。此外,为了对设备噪声进行充分的估计,同时考虑了两种噪声估计方法并进行了组合。在两个音库上的设备源辨认实验证明设备噪声特征比其他相关文献中使用的几种特征取得了更高的性能。5)针对录音设备源取证领域新近出现的从语音录音中进行盲信道估计,然后利用估计出的信道信息来表征录音设备的方法,首先提出了两种改进的盲信道估计方法。受到对数美尔谱系数(Logarithmic Mel-spectral Coefficients,LMSCs)和MFCCs在信道识别问题中所表现出的一定的互补特性的驱动,提出了一种基于联合谱聚类的盲信道幅度响应估计方法:基于两种特征分别进行一次谱聚类得到相应的纯净语音谱估计,最终的纯净语音谱估计是这两个谱聚类结果的一个折衷。此外,语音信号频谱的高频部分比低频部分更具有随机性,因此可以利用更精确的多窗谱估计(Multi-window Spectral Estimation,MWSE)来处理高频部分,从而减少高频部分谱估计的方差,为此提出了另一种新的改进的方法,称为双带盲信道估计方法:将语音录音通过一个截止频率划分成高低频部分分别进行盲信道估计,低频部分按照原始的方法采用FFT进行谱估计并提取RASTA-MFCCs进行盲信道估计,而高频部分则通过MWSE进行谱估计并提取MFCCs进行盲信道估计,最后将高低频部分得到的估计谱组合在一起得到最终的信道幅度谱估计。实验表明两种改进的方法较改进前都进一步提升了信道幅度谱估计的准确度。在得到了信道幅度谱估计之后,基于信道幅度谱以及原始语音录音信号幅度谱构建了表征录音设备的特征并应用于录音设备源取证中。在针对37个录音设备单元的设备源辨认实验表明了基于新的盲信道估计方法所提取的信道特征的有效性。
其他文献
蜂窝网日益面临着高效承载快速增长业务量的现实需求,这就要求蜂窝网在资源和能耗的双重约束下,优化网络资源的同时尽可能地降低能耗,打造绿色通信与网络。事实上,由于基站能
立足材料力学课程的知识背景、顺应大数据时代的需求,通过对课程的教学内容及方法、实验环节和考核评价体系等进行创新改革,达到引导学生自主学习,提高学习兴趣和参与度,提升
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
残疾人公共体育运动的设施建设有着其重要意义.首先,残疾人公共体育事业的发展是城市文明的重要标志,积极建设与发展残疾人体育运动公共基础设施建设能够更好的体现城市建设
期刊
摘要:PBL教学是现代护理教育必要的教学方法。本文主要探讨了在本科护理专业医学微生物学教学中引入PBL教学的必要性、PBL教学设计、PBL教学的优点及存在的问题。  关键词:PBL;护理专业;医学微生物学;教学改革  中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)47-0159-02  PBL(problem-based learning,PBL)是以问题为导向
《河北古代墓葬壁画》,河北省文物研究所编,文物出版社2000年11月出版。16开精装本,全书144页,彩版107幅,定价180元。该书对河北省历年来出土的壁画墓,包括安平逯家庄东汉壁
(中篇小说梗概)一这天上午快接近中午时分,当事人马鼎盛来到诉讼服务中心大厅,直奔王一梅的窗口去了。老马一脸的苦相,周身还散发着一种说不清什么味道的气味。而王一梅又是
期刊
目的研究开环式微创痔上黏膜切除吻合术(TST)治疗痔的围术期护理。方法从2015年6月~2017年8月这个时间段中取材并开展本次研究,所选取痔疮患者总计80例,这些患者在入院后均接
人们经常把茎蔓直立、旋转向上或细长柔软不能直立,但能攀附于支撑物,沿之而上的一些植物称为攀缘植物.这些植物种类繁多,形态万千,无论是主动攀升还是依附攀缘,都使绿化布置