论文部分内容阅读
近年来,许多研究机构都在研究流媒体安全领域的各种关键技术,以提高流媒体内容保护的性能和解决实际应用中的问题。本文对限制非法用户访问视频内容的加密和监测视频内容的副本检测两个关键技术进行了深入研究,实现了一个基于视纹的图像和视频副本检测演示系统。主要的研究内容和创新点如下:
(1)基于Waston视觉模型,提出了DCT子带视觉模型。视觉模型是正确抽取视觉特征、构造视纹抽取和匹配模型的基础,针对DCT系数的何种映射能够保持基本的图像信息仍然是一个难点问题,本文在Waston视觉模型的基础上,分析8×8DCT系数频率函数特性,为了取得较好的视觉指纹紧促性,提出了DCT子带灵敏度、亮度、对比度和感知距离模型,能够实现较为紧促的视纹。
(2)提出了基于DCT子带视觉模型的图像指纹方法。现有的各种DCT域图像指纹方法对常见的图像处理操作(几何失真操作除外)具有很好的鲁棒性,但区分性差,一个重要原因是无论视纹的抽取还是匹配模型都没有借助视觉模型。本文提出基于DCT子带视觉模型的图像指纹方法,按照DCT子带灵敏度模型,利用全局排序,将每个DCT子带映射为一个图像指纹比特,考虑到不同DCT子带对图像指纹间相似度的贡献不同,将DCT子带感知距离引入到哈明距离测度。实验表明,所提图像指纹算法的区分性可以满足MPEG图像指纹征集的要求(虚警率小于亿分之五),并且相比最近ISO/IECMPEG大会上提交的基于同心圆和基于Radon的图像指纹算法,鲁棒性(除几何失真外)和它们相当,但在紧促性和计算复杂度方面要明显更优。针对图像和视频字幕/Logo失真特性,改进了基于DCT子带视觉模型的图像指纹抽取模型,提出了基于中心长方形的图像指纹抽取模型。
(3)提出了基于帧间相似性的视纹方法。现有的基于块的空间域signature/指纹算法要满足较高的区分性和鲁棒性,往往以匹配计算复杂度和紧促性为代价。本文提出了基于帧间相似性的视纹方法,根据视频场景中的大多数的变化都是渐进的观察,该方法将视频片段根据变化情况分隔成多个视觉子镜头,将视觉子镜头视纹用两帧图像指纹,加上视觉子镜头持续时间得到最终的视觉子镜头视纹,一方面取得更好的视纹紧促性,另一方面降低视纹匹配计算复杂度。实验表明,所提图像指纹算法的区分性可以满足MPEG视纹征集的要求(虚警率小于百万分之五,紧促性远小于30kbps),除几何失真外,取得了较好的视纹鲁棒性。若将基于帧间相似性的视纹方法应用于原始视频序列的指纹抽取,对于某些应用,则可望进一步提高视纹检索效率。
(4)提出了基于熵编码的分组选择性视频加密方法。现有的关键域选择性视频加密方法可以减少视频加密数据量,但它们需要重新部分或全部编解码而导致额外的计算负载。为了有效降低视频加密计算复杂度,研究了视频编码中熵编码和视频传输特性,提出了一种用分组算法在熵编码层加密的选择性加密方法。实验证实,与现有关键域加密方法相比,所提出的加密方法无须解码视频序列,不影响视频压缩效率、错误可恢复性和传输性能,能有效地降低因加密操作带来的计算复杂度(无论对已经编码的还是未编码的视频),并且也可以克服编码错误隐藏带来的信息泄露问题,对多类视频的加密实验证实了方法的有效性。