快速镜头检测算法及目录式视频摘要提取

被引量 : 0次 | 上传用户:wyingying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了高效地利用飞速增长的海量视频资源,既需要能够快速找到期望的视频的检索技术,也需要能对视频内容进行快速浏览的视频摘要技术。视频摘要的主要应用包括监控类视频重要信息快速浏览、大型网站视频管理等各领域。本文实现了视频摘要的分层提取,主要分为镜头边界检测、关键帧提取、视频摘要快速分层表达和随机浏览。在镜头检测方面,为了提高实时性并且降低复杂性,主要分为三步进行。首先,以分区颜色直方图作为帧图像特征,计算基于双多尺度的帧差曲线,具体表现为在空间上进行分块,在时间上使用不同的间隔,并且分块尺寸和时间步长相匹配。这样既能保证对运动足够的容忍度,又能够保证足够的空间信息。其次,为了避免受到闪光灯和镜头前突然掠过目标等影响,考虑到镜头变化在相邻尺度上的稳定性,在检测切变时使用多个较小步长下的帧差乘积曲线,检测渐变时采用多个较大步长下的帧差乘积曲线,这样既能精确定位,又可以避免突发干扰。最后,使用双阈值进行切变帧和疑似渐变片段的定位,并且使用三角形准则对疑似渐变片段进行验证和精确定位。在关键帧提取方面,综合考虑了帧间内容相似性和时间相关性,设计了利用二次聚类提取关键帧的方案。首先,在第一次聚类中引入时间距离,采用自顶向下的分裂式层次聚类算法,得到镜头内基于灰度模式和时间相关性的一个较细的聚类结果。其次,第二次聚类建立在第一次聚类的基础上,既考虑灰度模式的相似度,又考虑每个聚类对应的时长信息,采用自底向上的凝聚式层次聚类将时间上分离、内容上相似的关键帧聚为一类。在聚类过程中考虑聚类数目和聚类类间类内距离两个聚类结束条件。选择聚类中心最近的点为关键帧。在视频摘要提取方面,在镜头内提取关键帧后,关键帧的数量仍旧很大,对镜头间的关键帧进行凝聚式层次聚类实现关键帧的分层表达。在界面的设计上,使用了树形控件,实现了关键帧的分层表示以及随机浏览。实验结果显示,本次设计具有较强的实用价值。
其他文献
<正>从1986年10月起,在日本千叶县车站附近的街头,人们经常可以看到一个男人手舞足蹈、慷慨激昂地发表演讲,向上班的人群阐明自己的政策,批评执政者的腐败。这一讲就是25年,
变频电源是一种将工频电通过一种功率转换装置(AC-DC-AC)按照实际需要转换成在一定范围内频率和电压可调的正弦交流电的电力电子装置。变频电源的难点是逆变控制系统,随着数
信息隐藏是数学、密码学、信息论与计算机应用技术相互结合的一个交叉性的研究课题。随着现代通信技术的发展和迅速普及,特别是随着由通信和计算机相结合而诞生的计算机互联
创新是一个民族进步的灵魂。二十一世纪的知识经济时代,人类社会正在经历一场全球性的科学技术革命。企业的竞争、经济的发展,综合国力的较量,日益集中地表现为科学技术的竞争。
国际警务合作,是不同国家的警察机关在警察事务领域为完成特定的警务相互提供支持、援助、协助、配合的一种执法活动。国际警务合作也是跨国界的执法活动,一国警察可以跨越国
雁栖湖畔北京日出东方凯宾斯基酒店作为2014年APEC会议使用的主要建筑之一,其建设过程是建设各方通力合作的过程,也是设计方案不断调整、修改、完善和思考的过程。作为高档星
构建基于智力资本的企业价值评估模型,从企业智力资本与财务资本的关系展开研究,通过新的价值评估模型发现,企业智力资本的差异性将带来企业价值的变化。通过引入智力资本,使
在高中文言文探究性学习中,教师既要注意培养学生阅读浅易文言文的能力,又要关注学生的人文素养,具体教学中可针对语言和内容展开探究,以切实培养学生掌握学习理解文言文的能
我国少数民族地区的经济发展取得了重大成就,但是扔存在着许多制约少数民族地区经济发展的因素。对少数民族地区经济发展的整体状况、制约因素和发展对策等进行研究,是少数民
属燃料电池 (MFC)是一类特殊的燃料电池 ,具有成本低、无毒、无污染、比功率高、比能量高等优点 .文章讨论了金属燃料电池的基本特性、结构和原理 ,综述了Al、Zn、Mg、Ca、Fe