论文部分内容阅读
伴随着科技的发展,大量的手持可摄像电子设备已经走进到广大群众的日常生活中,人们虽然在享受方便,快捷,丰富的各种多媒体信息,但是同时也感受到了对多媒体信息处理的各种困扰。其中视频信息的爆发式增长,使得视频信息在存储,传输,查询和选择的技术跟不上现实发展的需求。视频数据因生动,表达的内容非常丰富,直观的特点在多媒体数据当中占很大一部分,那么如何有效地管理和检索已经成为视频处理技术的研究重点。早期的基于文本标注的检索技术,不仅浪费了大量的人力和物力资源,而且检索结果带有很大的主观性,近年来,越来越多的科技工作者将注意力转到了基于内容的视频检索技术上。基于内容的视频检索技术是根据视频的主要内容以及其上下文之间的联系,在通过分析视频内容的基础上,提取各种可以代表视频主要内容的特征,根据特征在大规模的视频数据库中检索到感兴趣的视频场景。基于内容视频检索的关键技术有镜头的初步分割,关键帧的提取,代表视频内容的特征提取,视频的组织结构,检索结果反馈机制等等。本文对基于内容的视频检索的两个关键技术镜头分割和关键帧提取上开展了研究。在镜头分割上,本文提出了一种基于颜色空间的自适应阈值镜头分割算法,利用YUV颜色空间,进行分块加权统计相邻帧之间的差值,分别计算两个自适应阈值用来判断突变检测和渐变检测,在突变检测模块内增加了隔帧差值比较法,来消除光照等一些噪声所带来的误判,在渐变检测模块中应用了连续窗口值法,来检测是否发生了渐变。在关键帧提取上,提出了一种基于图像熵及边缘匹配率的关键帧提取算法。首先利用互信息将镜头集合划分成一个个的子镜头集合,然后在子镜头集合中利用图像熵找到其中包含内容最为丰富的图像帧得到一个候选关键帧集合,然后利用边缘匹配率将候选关键帧集合当中的一些冗余帧进行消除,得到关键帧集合。本文最后对研究的内容做了一个简要的总结,指出了一些不足和下一步需要完成的任务。