基于内容的视频检索中的视频分析技术

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sheen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要讨论了这一领域的相关问题.第一、二章介绍了基于内容的视频检索技术产生的背景及该项课题的研究意义,并讨论了视频数据的特点及当前的视频分析技术的发展状况.第三章在介绍多种镜头相似度的度量之后,我们着重讨论了视频基调,并引入了权值的概念,提出了一种基于赋权的镜头基调的镜头相似度度量,同时解决了镜头粒度上基调帧对乱序的问题.第四章则提出了一种将FuzzyC-Means聚类算法用于镜头分割的方法,克服了目前镜头分割的两种主要方法的缺陷:镜头改变检测算法难以准确预设阈值,聚类算法无法预先知道分类的具体个数.第五章讨论了远程教育领域PPT视频课件Slide的分割.我们针对第一类PPT视频课件提出了对应像素差的统计的分割方法,针对第二类PPT视频课件可能存在光照变化干扰,提出了对应像素差的统计与边缘像素数目差相结合的双测度的方法,较好地在速度和精度间进行了平衡.第六章则将注意力集中在MPEG视频的镜头分割.我们从MPEG-2码流中获得DC图,并将像素域中的像素亮度直方图的镜头分割方法运用到压缩域中,提出了双阈值的MPEG压缩视频镜头检测算法.第七章总结了全文,并对以后的研究工作进行了展望,提出了一种融合多种技术的视频镜头分割方法的框架.
其他文献
水电仿真系统的目的是建立一个对水电厂运行进行仿真的环境,用来培训运行人员,达到完成培训后即可上岗工作的要求.相比在真实仪器上的培训,它具有代价小、速度快的优势.其中
随着计算机网络的飞速发展,人们的生活方式也发生了巨大变化。人类逐步进入了信息时代。互联网的广泛应用在给人们的工作和生活带来了极大方便的同时,也带来了不能忽视的负面影
到目前为止,万维网已经成为世界上最丰富和最密集的信息来源,但是,它的结构使它很难用系统的方法来利用信息.为了高效率地利用这些数据,首先必须要研究异构数据的集成问题.以
计算机网络与数据库技术的迅速发展和广泛应用,使得“丰富的数据与贫乏的知识”问题亟待解决。因此,我们必须寻求新技术和自动工具,以便帮助我们从大量数据中找到潜在有用的信息
该文从一种特殊的遗传算法—CGA(Compact Genetic Algorithm)及其扩展(Extended Compact Genetic Algorithm)入手,通过大量实验比较了SGA(简单遗传算法)、CGA、ECGA的性能,提
该文中,作者对数字图象水印技术及其应用作了较深入的分析和研究.主要在以下四个方面做出了努力:1、对有关数字水印的基本知识作了详细的介绍和总结,包括数字水印的背景、基
该文设计了一个基于整体特征的自动人脸识别系统,其主要有三个部分组成:预处理、特征提取和分类器设计.对于一个全自动的人脸识别系统来说,其关键的一步就是人脸的定位.该文
随着互联网和相关技术的飞速发展,TCP的固有缺陷表现的愈发明显,SCTP替代TCP成为下一代互联网的传输协议已被业界达成共识。为了聚合带宽,提高端到端传输的吞吐量,在SCTP的基
入侵检测是最近10余年发展起来的一种动态的监控、预防或抵御系统入侵行为的安全机制.和传统的预防性安全机制相比,入侵检测具有智能监控、实时探测、动态响应、易于配置和适
该文以流媒体形式的PPT课件作为研究对象,针对PPT视频图像的独有特征,提出了一种按内容组织该类视频流场景分段的方法,引入重要性得分(significance score)概念,对视频场景段