基于内容的视频快速索引

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:shan850312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和多媒体技术的迅速发展,媒体影视数量不断增加,如何在海量存储库中寻找自己感兴趣的视频成为一个新的问题。尤其是随着智能手机的普及和三代视频(3G)的到来,如何实现快速视频浏览,自动挑选视频中感兴趣的场景,已成为当前视频分析与检索研究的热点问题之一。本文针对基于内容的视频索引技术,包括镜头切换检测、关键帧提取、镜头聚类等,提出了一种快速索引的方法,实现手机平台上的快速视频索引,自动剪辑出感兴趣的场景。将视频内容分为风景(Landscape),人脸(Portrait)和运动目标(Object)三种模式,用滑动窗口的方法计算出每个时间片的感兴趣程度:在Landscape模式下,进行各种颜色模型的分析,采用HSV空间的直方图统计,用局部累加直方图对比相邻帧的差异;在Portrait模式下,研究了人脸定位的关键技术,用帧间差分法得到一幅差图像后,利用水平投影直方图分析人脸所在的大致位置,综合统计人脸区域的变化,包括亮度、大小和位移;在Object模式下,研究了图像跟踪技术,判断目标物体运动的程度,采用基于曲率的角点算法提取过量的角点及基于光流的跟踪算法得出目标的运动矢量。在选择对应的模式后,计算每个时间片的感兴趣程度并排序,输出感兴趣视频。实验和测试表明,该方法索引的准确度高,实现速度快。
其他文献
本文首先介绍了感应加热的原理,以及感应加热的特点和发展现状。通过研究两种经典的谐振拓扑,分析它们在高频下的工作特性,总结了在高频段经典谐振拓扑结构受到的制约以及原因。通过分析通信工程中的L匹配网络,以及在射频电源中经常采用的CALSS-D半桥拓扑,引出了一种可以在高频段有良好工作特性的CALSS-D半桥电压型LCLR谐振回路。本文分析了LCLR谐振回路的谐振特性,推导出了LCLR谐振回路具有变压器
感应耦合电能传输(ICPT)技术是一种基于电磁感应效应而实现电能近距离无线传输的技术。一方面,利用一般的参数优化方法设计出的ICPT系统存在不能同时满足多个设计目标,灵敏度高等缺点,这限制了其有效性与实用性。这是因为,首先,实际应用场合通常都要求满足多目标的系统。其次,实际环境中无法避免的多变性与不确定性会导致一个灵敏的ICPT系统性能急剧下降,甚至可能到不可用的地步。如何使设计的ICPT系统满足
1928年杭州国立艺术院创办成立,与远在北平的艺专一起,开始了现代中国美术漫长而辉煌的发展时期。借鉴西方学院式写生教学,可谓是20世纪中国美术教育横空出世的一大壮举,林风
污水处理系统由于污染物质的多样性、复杂性和变化性,属于难以控制的复杂工业过程。而模糊控制中的模糊推理规则和隶属函数的选取往往是依据相关专家或技术人员的实际经验,具有
钢铁工业是高能耗行业。煤气系统是钢铁企业能源系统的重要组成部分,钢铁生产过程中产生大量二次能源,副产煤气在其中占有较大比重。在钢铁企业搞好能源管理工作,特别是煤气
学位
包含随机输入及其它外部干扰、非线性项与不确定动态的随机系统广泛存在于工业过程、化学化工、航空航天等实际应用中,其中含有非高斯随机变量的复杂随机动态系统已经成为控制
纹理合成及纹理映射是三维模型获得真实感的重要技术,是计算机图形学领域的研究热点。纹理合成和纹理映射在虚拟现实场景、三维动画制作、游戏以及虚拟博物馆等领域得到了广
核磁共振(MRJ)脑图像的颅内各组织边界复杂且不规则,所以对其的分割是医学图像处理一个重要而困难的课题。支持向量机(SVM)是一种全新的模式识别技术,其思想是建立在统计学理
小波变换可以实现对一维信号的稀疏表达,并且自1995年Donoho等人提出阈值方法之后,基于小波变换的阈值去噪方法得到了广泛的研究,并取得了良好的效果。图像具有多方向性和各
最后,针对每个模态都存在执行器故障的垂直起降飞机切换系统模型,设计三个具有级联结构的扩张故障诊断观测器系统分别估计每个模态的未知故障信息,利用最优控制技术和积分滑