论文部分内容阅读
多媒体技术的快速发展和互联网的广泛应用,促使网络视频呈现爆炸性的增长趋势。同时,不同的用户往往根据自身的需求对视频进行各种编辑处理,如剪切、格式转换、添加边框、尺寸变化等,生成不同版本的视频,使视频资源变得极其丰富。这些丰富的视频资源对视频的检索、内容管理和版权保护等造成了严峻的挑战。基于视频哈希的视频拷贝检测技术对视频的信息检索、视频版权保护、视频数据库的去冗余和管理、视频特定内容的检测与过滤、视频跟踪等方面有着重要的应用。因此,如何建立更有鲁棒性的视频拷贝检测系统成了国内外研究的热点。本论文首先介绍了视频哈希算法的基本理论知识,包括:视频的数据特征、视频哈希的定义、视频哈希算法的评价标准等;然后提出了一种基于镜头分割的视频哈希算法;最后根据视觉关注模型对视频内容的显著作用,提出了一种基于时空域视觉关注加权的视频哈希算法。本文的主要创新和贡献在以下两个方面:(1)提出了基于镜头分割的视频哈希算法。该算法认为同一个镜头内的视频帧的内容在视觉上几乎是相同的,而不同镜头内的视频帧的内容相差比较大。因此,在形成时域代表帧的过程中,仅仅采用固定帧数的分割并不能很好地描述视频内容,而且降低了从时域代表帧上提取到的视频哈希的鲁棒性和区分性。基于镜头分割的时域代表帧在表征视频内容上表现出更好的优势,且从时域代表帧上生成提取的视频哈希在紧凑性、鲁棒性和区分性上有着更好的性能。(2)提出了一种基于时空域视觉关注加权的视频哈希算法。传统的视频帧加权方式是指数加权或平均加权。尽管这两种加权计算简单,却没有充分考虑人眼对视频内容变化的关注程度的不同。提出的算法根据人眼对视频内容的视觉关注的不同程度的变化,计算每一帧的时域视觉权重,从而生成能够描述视频帧的受关注程度的时域代表帧。从这种时域代表帧上提取的视频哈希不仅能够体现视频受关注内容的重要程度,而且提高了视频哈希的性能。本文提出了两种生成视频哈希的算法,这两种算法通过不同方式生成的视频哈希对视频内容进行简约性表征。视频哈希的简约形式使得其在很多方面有应用价值。如大数据时代背景下,检索大数据时所必须的索引以哈希的形式存储,不仅简化了检索过程而且提高了检索效率。另外,哈希还可以辅助移动设备完成PC机上进行的计算过程。因此,视频哈希能够在现在或未来的大数据环境以及移动计算环境中得到有价值的应用。