基于内容的视频检索技术探索与研究

来源 :大经贸 | 被引量 : 0次 | 上传用户:emperornjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】 本论文主要讨论了镜头分割、关键帧提取的算法,是一篇基于内容的视频检索技术研究,着重研究了视频分层结构的有关步骤及算法以及视频内容特征的提取。
  【关键词】 关键帧 信息检索 近似匹配 特征提取
  1 视频检索概念及特点
  1.1视频检索的概念
  基于内容的视频检索(CBVR)是指根据媒体的内容语义及上下文联系进行检索。CBVR需要利用图像处理、模式识别、计算机视觉、图像理解等学科中的一些方法作为基础技术。CBVR不仅是基于内容的,而且是一种信息检索技术。
  1.2视频检索的特点
  1、从视频数据中提取信息索引
  基于内容的检索突破了传统的基于关键词检索的局限,它直接对视频内容进行分析,抽取特征和语义,利用这些内容特征建立索引,并进行检索。
  2、 基于内容的视频检索是一种近似匹配
  对内容的描述不是一种准确的描述,因此,CBVR采用相似性匹配的方法逐步求精,以获得查询结果,即不断减小查询结果的范围,直到定位于要求的目标。这一点与常规数据库检索中的精确匹配方法不同。
  2 传统的视频检索体系结构
  我们知道传统的视频检索技术主要包括镜头检测、关键帧提取或镜头集类、特征库的建立以及匹配算法等,主要提取视频特征。传统的方法是先对视频完全解码,再分割镜头并提取关键帧,最后提取特征,这样就会产生计算量比较大,影响视频检索效率,而对特征的描述也是使用比较直观抽象的语言,交互性较差。
  3 视频内容的分层结构
  视频包含着丰富的内容。一般对视频采用分层的表达方式表示视频。一个视频可以表示为场景、镜头、帧几个层次,视频分层结构如下图。视频可以先分为场景,场景可以分为镜头,帧是视频最基本组成单元。将视频分为场景的处理叫做场景检测,将场景分为镜头的操作叫镜头分割,镜头分割是视频层次化的基础。
  4 提取镜头的有关步骤及算法
  视频数据可以按照由粗到细的顺序划分为四个层次结构:视频(Video)、场景( Scene)、镜头(Shot)和图像帧(Frame)。整个视频结构构造过程分以下三个步骤:从视频流中提取镜头、从镜头中选择关键帧和从视频流中构造场景或组。
  4.1从视频流中提取镜头
  镜头是视频数据的基本单元,视频处理首先就需要把视频自动地分割为镜头,以作为基本的索引单元,这一过程就称为镜头边界的检测。它是实现基于内容的视频检索的第一步,其核心处理是镜头切变检测。
  1、基于颜色的特征方法
  (1)模板匹配法
  模板匹配法又称对应像素法,模板匹配法是将两帧对应像素差的绝对值之和作为帧间差,当帧间差大于某个阈值t时,则认为有镜头的切换。模板匹配法的缺点是,由于与像素的位置密切相关,因此对噪声和物体运动十分敏感,容易造成误识别。也有人提出将各帧划分为8×8像素的子块,并对每个块取平均,再用这个平均值对前后帧的对应子块进行比较,这种方法对小的噪声和运动不敏感。
  (2)直方图法
  直方图法是使用得最多的计算帧间差的方法,它丢失了颜色的位置信息,因而抗噪声能力要比模板匹配强。颜色直方图法的缺点是,两幅图像可能内容完全不同但直方图相似,也容易造成误识别。一种改进的方法是将图像划分成若干子块分别对各子块进行匹配。
  (3)基于边缘的方法
  由于在镜头切变时新旧边缘应在不同的位置,所以可先提取两幅图像的边缘,计算新边缘在旧边缘的基础上增加和减少像素比例,当大于某一个阈值时便认为发生镜头切换。缺点是计算量大,当边缘不明显时效果差。
  2、光流检测法
  另外还有一种光流检测法,该方法的原理是镜头切换时无光流,而镜头运动应适合某种特定的光流类型。它能将渐变切换与镜头的运动区分开来,但计算复杂且在光照变化很大情况下检测失败。
  3、基于模型的方法
  Hampapur等人通过对视频制作过程的研究,提出了一种可用于镜头边界检测的视频编辑模型。它的缺点是,建模过程比较复杂,需要对每种切换类型建立模型。这种方法适用于专业领域。
  4、几种改进的算法
  双阈值比较法:当两帧间差在阈值d1和d2之间时,便认为潜在渐变开始,将差值开始累加,直到累加和大于d2时认为有渐变,当帧间差小于d1时认为渐变结束。这种方法对渐变检测有较好的效果,但对镜头的缓慢运动仍可能会造成误识别。
  滑动窗口检测法:先以待检的帧作为中心开一个窗,计算各帧与邻帧的帧间差,若该帧的差值大于窗口内的其它所有帧的差值,且大于第二大差值的某倍数,则认为是发生切换。
  用双重窗口法可进一步改进以减小搜索量,先选取一个大的窗口,取平均值,将大于均值一定倍数的差值作为候选切变帧,再以候选切变帧为中心取小窗口,检测具体位置。大窗口可避免误检并减小搜索量;小窗口可避免大运动造成的漏检。
  由于在很多情况下,人们仅对图像中的某一区域感兴趣。因此,先进行图像分割,仅利用某一区域的信息进行检索。近几年来这一领域的研究逐渐引起了人们的兴趣。
  4.2从镜头中选择关键帧
  关键帧(也称代表帧)是用于描述一个镜头的关键图像帧,它通常会反映一个镜头的主要内容。关键帧的使用大大减少了视频索引的數据量,同时也为检索和浏览视频提供了一个组织框架。关键帧的提取原则是“宁滥勿缺”。关键帧选取的方法有以下几类:
  1、基于镜头的方法
  一段视频分割成镜头后,将每个镜头的首帧(或首帧与末帧)作为镜头的关键帧。该方法实现起来比较简单,无论镜头的内容如何,关键帧的数量都是一定的(1帧或2帧),但效果不是很稳定,因为每个镜头的首帧或末帧不一定总是能够反映镜头的主要内容。   2、基于内容分析的方法
  这种方法基于每一帧的颜色、纹理等视觉信息的改变来提取关键帧,当这些信息有显著变化时,当前的帧即可作为关键帧。张宏江等人依据帧间的显著变化来选择多个关键帧,首先把镜头的第一帧作为关键帧,然后计算前一个关键帧与剩余帧之差,如果差值大于某一阈值,则再选取一个关键帧。这种方法可以根据镜头内容的变化程度选择相应数目的关键帧,但所选取的帧不一定具有代表意义,而且在有镜头运动时,容易选取过多的关键帧。
  帧平均法和直方图平均法统计所有帧的像素值或直方图平均,取最接近平均值的帧作为代表帧。
  3、基于运动分析的方法
  Wolf通过光流分析来计算镜头中的运动量,在运动量取局部最小值处来选取关键帧,它反映了视频数据中的静止,视频中通过摄像机在一个新的位置上停留或通过人物的某一动作的短暂停留来强调其本身的重要性。Wolf的这种基于运动分析的方法可以根据镜头的结构选择相应数目的关键帧。如果先把图像中的运动对象从背景中取出,再计算对象所在位置的光流,可以取得更好的效果。
  合成法将镜头中的所有运动转换拼接成一个合成帧作为关键帧。
  4、基于聚类的方法
  聚类提取的方法首先要确定一个初始类心,然后根据当前帧与类心的距离来判断是归为该类还是作为新的类心,再将镜头中帧分类后取各类中离类心最近的帧作为关键帧。另外,Zhao提出了一种基于最近特征线(Nearest Feature Line,NFL) 的端点检测算法用于选取关键帧。该方法的主要原理是用某些特征点的连线(特征线)近似并代表某个类的所有特征样本轨迹,而这些特征点就是关键帧。
  4.3从视频流中构造场景或组
  计算镜头间的相似性(实际是关键帧间的比较),选择合适的聚类算法进行分析。按时间顺序和关键帧的相似程度可分为场景,也可以只按关键帧的相似程度进行分组。
  结束语
  本文主要讨论了镜头分割、关键帧提取的算法,但还有许多的问题有待解决和面对,如应选取更为有效的视频特征,现有的颜色、纹理等特征还不能有效表示视频的内容,为了提高镜头和场景检索中的查全率和准确率,应该选取更为有效的视频特征,这就给我们未来的研究提出了方向。
  【参考文献】
  [1] 陈尧,张青荣.基于内容的视频检索技术研究[J].产业与科技论坛,2017,16(14):46-48.
  [2] 李向伟,康毓秀.基于内容的视频检索与挖掘关鍵技术研究[J].软件,2014,35(08):26-31.
  [3] 陈秀新.基于内容的视频检索技术浅析[J].信息技术与信息化,2011(02):56-58+75.
其他文献
【摘 要】 本文利用重庆市2004年-2016年的房地产产业相关统计数据,运用优化的扩散指数模型,对重庆市房地产价格的波动进行了实证分析,分析结果表明,近几年重庆市房地产价格不断攀升,预测未来几年重庆市房地产价格还将继续稳中有升,导致房地产价格波动的原因涉及土地供给、政府政策、消费者自用与投资(投机)、开发商人为操作等宏、微观因素,建议政府完善土地市场调节机制、出台政策措施打击非法炒房、完善经济适
期刊
【摘 要】 朝鲜族村隶属于河北省秦皇岛市北戴河新區,它远离朝鲜族聚居地,处在汉族的包围之中,是一个典型的语言文化孤岛。朝鲜族村南临渤海,位于秦皇岛市西南的洋河西南岸,北靠京山铁路和津秦公路,距秦皇岛市35公里、抚宁县城26.5公里、留守营镇6公里,距205国道只有两公里,之间有水泥公路连接,交通十分方便。朝鲜族作为北戴河新区唯一的民族村,发展出了以外出务工为主,农业和旅游观光为辅的经济发展模式,形
期刊
【摘 要】 依托于文化自信的政策背景,文化产业发展空前繁荣。国有文化企业由于自身规模体量大,在文化市场中成为不可或缺的重要组成部分。本文通过分析国有文化企业发展现状与存在问题,从政府与企业的角度提出了相应的对策,以期为国有文化企业发展提供一些参考建议。  【关键词】 国有文化企业 发展 问题 对策  随着近几年文化产业的繁荣发展,各种规模的文化企业雨后春笋般涌现出来。且伴随着国家的文化事业单位转型
期刊
【摘 要】 高校基层党支部是高校党建工作的基础,是思想政治教育工作的前沿阵地。新时代党建工作的标准化、流程化要求的提高,对基层党支部工作开展提出了全新要求。加强基层党建是大趋势,充分发挥基层党支部的战斗堡垒作用是关键。结合高校党支部工作实际,多方面探讨高校的基层党支部建设,寻找有利途径充分发挥高校基层党支部战斗堡垒作用。  【关键词】 高职院校 基层党支部 战斗堡垒 有效途径  随着全国高等教育思
期刊
【摘 要】 本文选取1986—2016年湖北省旅游业及经济增长的时间序列数据,通过运用协整检验、VAR模型、格兰杰因果检验及脉冲响应等方法,来对湖北省旅游总收入与湖北省地区生产总值两者之间的关系进行量化分析。结果表明:湖北省旅游业与经济增长存在单向作用,经济增长能够促进旅游业的发展,但旅游业的发展对经济增长作用有限。  【关键词】 旅游业 VAR模型 协整检验 脉冲响应  湖北省作为中部大省,旅游
期刊
【摘 要】 公债是目前世界各国广泛采用的一种财政上筹措资金的形式,特别是资本主义国家都把公债作为弥补财政赤字的主要手段。通过适当地借债可以集中社会闲散资金,为经济发展提供资金支持,也可以提升公共服务水平、增进社会福利,但是,举债行为本身就伴随着风险,债务风险的防范是关系到一国长治久安的重要问题,因此,政府债务一直是诸多经济学者十分关心的问题,本文想从中外政府债务理论的发展中正确认识政府债务,从而为
期刊
【摘 要】 近年来,电子竞标采购模式发展十分迅速,采购活动作为供应链管理的重要环节,也是企业节约成本的主要渠道之一。本文主要介绍了电子竞标采购定义及特点,并对其优势和劣势进行分析,最后阐述了电子竞标在国内外发展状况。  【關键词】 电子竞标 采购 平台  1.电子竞标概述  电子竞标采购是在传统采购模式的基础上发展而来的现代采购技术,电子竞标“E-Auction”最早出现于国外。在我国,电子竞标也
期刊
【摘 要】 通过文献梳理方法深入了解我国农村医疗保障制度,并对医疗保险各阶段各组成部分的现有研究进行细分,找出现有研究不足并提出未来可能的研究创新点,为今后农村医疗保障制度相关研究提供文献支撑,并为整个医疗保障体系提供借鉴。  【关键词】 新农合 城乡医保 一体化 综述  新型农村合作医疗制度在全国主要有以下3个角度:一是关于筹资机制研究。戴卫东[1](2008)指出,建立新农合的首要问题是资金筹
期刊
【摘 要】 杭州素有鱼米之乡、丝绸之府、“人间天堂”之美誉,国家历史文化名城和重要的风景旅游城市,中国重要的电子商务中心之一。从1978年十一届三中全会以来,中国的改革开放已经40年整,这期间杭州的经济迅猛发展,综合实力显著提升,成为名副其实的国际名城和生活品质之城。作为民富省份浙江省的省会,杭州的民营经济十分发达,在经济发展新常态下,杭州正在进行经济转型,大力发展高端制造业和以“互联网+电商”的
期刊
【摘 要】 目前我国运用定量工具分析经济学问题占据主导地位,以至于忽略问题的本质,对问题本身的性质的分析。本文以美国对中国的钢铁行业反倾销为例,运用定性与定量相结合的方法,探究背后原因与理论机制,最后得出结论。  【关键词】 定性分析 定量分析 反倾销  一.引言  随着当今数学工具和水平的发展,定量研究越来越流行于学术论文中,学者们充分利用计算机等数学工具及软件,通过将各种指标数据化,经过严格的
期刊