基于内容的视频分段技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kongguoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和网络技术的飞速发展,人们越来越容易获得大量的视频信息,对这些信息的组织、管理和检索将直接影响对这些信息的有效利用。基于内容的视频检索正是为解决该问题而引入的一个新的研究领域,并逐渐成为多媒体领域的研究热点,其中视频分段是基于内容视频检索的基础和重要步骤。视频分段包括视频镜头边界检测和场景分割。论文在分析突变镜头特点的基础上,设计了一种新颖的滑动窗帧差模型,并依据该模型推导出了镜头边界系数的计算方法。通过采用镜头边界系数与非均匀分块和高斯加权HSV直方图相结合的方法获得帧间差,将此帧间差作为自组织映射神经网络分类器的输入值,进行分类处理后便得到突变镜头集。渐变镜头检测采用的是基于幅角-模值联合直方图算法。在对帧图像作一次两层的小波变换后,求获得低频分量图像的梯度,以该梯度的幅角和模值组成的联合直方图绝对差为特征,并对该特征进行形态学开运算以得到更加光滑的曲线,采用滑动窗高斯模型确定渐变镜头集。在检测出镜头边界的基础上,通过提取镜头关键帧,求出各关键帧的颜色结构直方图并对其进行模糊聚类分析,进而对视频的场景进行分割。实验结果表明,突变镜头检测算法具有很强的鲁棒性,对任意视频都能取得很高的准确率和查全率;渐变镜头检测算法并非只针对某种特定的渐变类型有效,对于各种渐变类型都有较好的检测性能;场景分割算法也取得了较好的效果,但由于涉及到聚类阈值的选取,因此自适应程度不高,需要进行进一步的研究和改进。  
其他文献
EXT2(第二代扩展文件系统)是早期GNU/Linux操作系统标准文件系统,是一个功能强大、易扩展的、性能上进行了全面优化的、支持长文件名的文件系统。它是Linux文件系统类型中使用
在统一建模语言(Unified Modeling Language)UML2.0规范中,模型的语法是通过元模型以类图形式定义的,静态语义用对象约束语言(Object Constraint Language)OCL描述,动态语义直接
对等计算(P2P)相关的应用在因特网上非常成功。BitTorrent系统是目前因特网上最大的P2P文件共享系统,据统计2004年,BitTorrent协议相关的流量占了因特网总流量的35%。BitTorr
随着人类认识自然和改造自然需求的增长,大规模高性能计算已经成为人们生产生活中不可缺少的研究方法。高性能计算被广泛应用于气象预测、航空航天、核试验等重要领域,实现科学
实验教学是高校教学工作的一个重要组成部分,它在培养学生的基本技能和创新能力上有着不可替代的作用。而目前实验室的管理方式存在着管理不透明、实验教学计划随意更改、实
基于身份的公钥密码体制及其应用已经越来越受到重视,如何构建一个安全性高效率好的公钥密码体系称为一个重要的研究方向。基于身份的密码体制中,公钥是用户的身份,如姓名,邮件地
随着即时通信业务的广泛应用,它已经成为继电子邮件后又一大热门的互联网应用。目前国际上虽有多个组织在从事即时通信、Presence技术及多媒体会晤方面的相关研究,但是还没有形
随着无线通信技术和互联网技术的飞速发展,移动通信业务从以前的语音业务逐渐向丰富多彩的数据业务过渡。虽然传统的电子商务已经使人们感受到了网络所带来到的便利和乐趣,但
无线Ad Hoc网络实现了没有基础设施环境下的移动节点自由互联,在军事领域及民用服务领域都有广泛的应用前景,因而受到了学术界广泛关注。但其固有的独特特征也带来了许多研究
基于构件的软件开发技术的迅速发展,给软件测试带来了很大的变革,使得基于构件的软件测试成为人们研究的热点。由于构件化软件本身的特点,使构件化软件集成测试与传统软件集