论文部分内容阅读
基于网络语音流的隐蔽通信技术在带来高安全性的同时,也带来一些不可估量的危害。因此,我们需要研究其反制措施-隐蔽通信检测技术。从当前的研究现状来看,现有的大部分隐蔽通信检测方法都是专用型的,即现有的大部分隐蔽通信检测方法都建立在嵌入率、嵌入方法和嵌入域已知的前提下。然而由于嵌入率的不确定性、嵌入方法复杂性和嵌入域的多样性,在实际场景中,这些都是未知的。因此,为了解决这些问题,本文分别提出了针对未知嵌入率的网络语音流的检测方法、针对未知嵌入方法的网络语音流的检测方法和针对未知嵌入域的网络语音流的检测方法。具体研究如下:(1)针对未知嵌入率的网络语音流隐蔽通信检测,现有的基于DST证据理论的检测方法存在数据失配的现象。基于此,通过对未知嵌入率的数据特性进行分析,本文提出了一种新颖的隐蔽通信检测方案,该方案首先利用K-means聚类算法来实现预分类,即将具有不同嵌入率的语音样本划分为几个簇,之后利用每一个簇中的语音样本训练基于XGBoost算法的分类器,最后实现最终的分类。在每一个簇中,通过引进多类别的训练机制,可以有效地避免样本不均衡的问题,从而提升分类性能。本文提出的方案与基于DST证据理论的检测方法在不同隐蔽通信方法数据集进行了一系列比较,实验结果表明,与基于DST证据理论的检测方法相比,本文提出的方案在检测性能上有所提升。(2)目前现存的大部分隐蔽通信检测方法都建立在隐蔽通信方法已知的前提下,但现实情况下隐蔽通信方法都是未知的。基于此,通过对未知嵌入方法的网络语音流的数据特性的分析,本文提出了两种检测方案。第一种是基于决策融合的隐蔽通信检测方案,该方案首先针对每一种隐蔽通信方法训练一个分类器,然后通过决策融合将每一个分类器给出的结果进行融合。第二种是基于自步集成的隐蔽通信检测方案,其核心思想是基于多次迭代过程训练多个分类器。在每次迭代过程中,通过不断地搜索边界样本,从而为集成的分类模型提供一个分类性能相对最佳的基分类器。实验结果表明本文提出的两种检测方案都可以用于未知嵌入方法的网络语音流隐蔽通信的检测,且基于自步集成的检测方案的性能优于基于决策融合的检测方案。(3)现有的隐蔽通信检测方法主要针对于单一嵌入域,但在实际场景中,嵌入域通常都是未知的。基于此,通过对多个嵌入域的参数特性进行分析,本文提出了可以应用于多个嵌入域的隐蔽通信方法的检测方案。该方案首先利用embedding技术将每一个语音序列中的码字映射到一个连续的高维语义空间,然后采用全局池化层对语音序列进行压缩,之后再利用拼接层将多个语音序列进行拼接,最后利用两层的全连接网络获取不同序列的之间的联系,并得到最终的输出。实验结果表明本文提出的检测方案可以应用于多个嵌入域的隐蔽通信方法检测,并且针对单一嵌入域的隐蔽检测方法的检测性能上优于现有的隐蔽通信检测方法。