基于语义的视频检索关键技术研究

来源 :华北电力大学(保定) | 被引量 : 0次 | 上传用户:xiangdi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着因特网和信息技术的快速发展,多媒体信息急剧增加,如何对海量的视频进行有效的检索和查找,成为目前迫切需要解决的问题之一。现有的视频检索技术大多是基于低层特征,由于这些低层特征与高层语义概念之间存在语义鸿沟,严重影响了视频检索系统的实用性,如何使计算机按照人的思维理解来检索视频,正成为视频检索中最具有挑战性的研究内容。
   本文对语义视频检索的关键技术,从以下四方面:视频镜头检测、关键帧提取、低层特征提取、高层语义提取进行研究,主要内容如下:
   在镜头检测中,与其他特征比较,选用累计亮度直方图作为镜头的特征,采用自适应的方法检测突变镜头和渐变镜头,在突变镜头检测中,利用帧的相关性和边缘方向直方图来排除闪关灯的干扰;在渐变镜头检测过程中,采用隔帧累计直方图帧差来检测镜头的渐变。实验结果证明这种方法能很好的检测出突变和渐变镜头,体现了自适应性,提高了镜头检测的正确率。
   在关键帧提取过程中,针对以往方法主要根据整帧图像的特征变化来提取关键帧,而忽略了视频对象的影响,本文提取整帧图像的特征,t同时重点关注包含运动对象的视频帧。首先采用高斯背景模型进行目标检测,当检测到运动目标且运动目标所在的区域面积最大时,把当前帧作为关键帧,同时保存运动目标。通过实验证明,这种方法能够有效地提取视频关键帧。
   在低层视觉特征提取中,对关键帧分别提取颜色、纹理、形状的不同表示方法,局部特征采用基于Bag-of-Visual-Words的SIFT提取方法,将提取的特征训练支持向量机。测试和比较了不同视觉特征对语义检测的性能,实验结果证明加入局部特征在一定程度上提高了语义检测的准确度。
   在高层语义提取中,在对关键帧提取各类低层特征和视频对象提取形状特征的基础上,提出对关键帧和视频对象的分类结果进行加权融合的方法。实验数据证明这种方法提高了语义分类的正确性,同时比较了不同的融合方式对语义检测的性能。
  
其他文献
期刊
会议
期刊
学位
期刊
期刊
会议
期刊
期刊
会议