论文部分内容阅读
随着计算机、网络和多媒体技术的迅速发展,人们越来越多的接触到大量的视频信息。如何从包含大量信息的庞大视频库中检索出所需要的有用信息,已经是一个迫切需要解决的研究难题。目前,对视频信息的检索主要利用图像处理和人工智能等技术对视频实际内容进行分析和处理,即基于内容的视频检索(CBVR, Content-Based Video Retrieval),该研究领域目前是图像处理的热门研究课题之一。基于内容的暴力视频检索广泛应用于视频分级、影视剪切及公共安全等领域。本文主要研究含有爆炸和枪击内容的暴力场景的视频检索与提取。首先对视频分割问题进行了研究。分析了视频数据的特点以及视频的结构。在对视频分割的典型算法进行系统研究后,主要实现了双阈值算法和基于直方图的模糊C-均值聚类算法(HBFCM)。并针对HBFCM算法提出了改进,不仅消除了溶图现象而且使信息熵小的关键帧大幅减少。实验结果表明,改进后的算法对视频分割的效果较好。其次对基于内容的图像检索技术进行了研究。分析了图像的低层特征(颜色、纹理、形状等)。实现了基于累加颜色直方图的图像检索算法,并对爆炸场景中的图像进行了检索。提出了一种基于局部自动颜色相关图的图像检索算法,并根据设计的火焰特征模板和浓烟特征模板对爆炸场景中的图像进行了检索。实验结果表明,基于局部自动颜色相关图的图像检索算法的查全率和准确率能同时达到约70%以上。最后对音频在检索暴力场景的应用进行了研究。分析了音频数据、音频帧和音频段的特征。针对利用图像特征难于有效检索到枪击场景的问题,设计了一种基于过零率和短时能量(ZCR-STE)的枪击场景检索算法,提出了一种新的音频段短时能量的计算方法。实验结果表明,基于ZCR-STE的算法能够较好地检索出枪击场景,同时提出的短时能量计算方法在查全率方面大大优于均值计算方法。