基于特征聚类的视频摘要生成技术研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:game780
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的视频分析检索与索引技术是当前多媒体领域研究的热点之一。如何利用视频的数据特征提取视频中的精彩片段生成视频摘要具有很高的实用价值和广泛的应用前景。本文提出一种基于特征聚类的视频摘要生成方法,主要工作包括视频特征提取、特征降维、特征融合、特征聚类、基于聚类的关键帧提取和摘要生成几个部分。特征提取方面:本文选择的是颜色纹理特征CEDD(Color and Edge Directivity Descriptor)和视觉词汇直方图的融合特征。CEDD颜色纹理特征使用模糊分类的方法融合了颜色和纹理两种底层常用特征,实验效果良好,并且具备存储小、处理速度快的优势;另一方面,视觉词汇直方图是以基于SIFT特征为基础,量化到视觉词典生成的一个直方图描述。本课题的视觉词典是由K均值方法聚类而成,输入数据包括电影、动漫、新闻、音乐视频、体育、实时拍摄共计450万幅帧图片,最终将词汇容量选定为10000个。特征降维方面:为了能够降低后续处理的时间复杂度,本文对词汇直方图进行了 PCA主成分分析,降低了直方图维度,大大提高了计算能力。特征融合方面:对CEDD特征和降维后的视觉词汇直方图特征进行了融合,使特征的描述更加全面。在实验检测方面,课题利用平均归一检索秩(ANMRR)的方法对融合特征进行了检测,图像库选择的是检索领域常使用的James Wang数据库,最终发现融合特征的ANMRR值为0.24,检索性能明显优于其他特征的效果。特征聚类方面:本文选择的SGONG自适应聚类来提取关键帧。相比于其他聚类方法,该方法无需人为设定聚类个数,能够根据数据自适应聚类。课题对6个视频做了实验测试,采用查全率和查准率的方法对结果进行分析,并和传统的基于颜色特征的镜头分割方法做出比较,最终表明本文方法的查全率和查准率均高于传统的镜头分割方法。关键帧提取和摘要生成方面:从聚类结果中找出和类中心距离最近的帧当作关键帧,以类内帧数在总帧数中的所占比例决定各个类的关键帧个数,根据用户选择的视频摘要长度决定关键帧个数以及相关帧个数,最终生成任意长度的视频摘要,从而保证摘要的准确性和流畅性。实验对一个15分钟的新闻视频进行测试,分别生成了 90s和4min两种长度的摘要。其中90s的摘要包含101个关键帧和2207个相关帧,其中关键帧的正确率为
其他文献
数字集群系统提供安全、可靠以及高速的语音和数据通信,在全世界取得了迅猛发展。因此,开发具有我国自主知识产权的数字集群系统具有重要意义。数字集群交换机的电路模式控制
稀疏表示是近些年发展起来的信号与图像处理工具,可以将信号和图像分解为非常简洁的表示形式。图像压缩技术在图像处理中有着重要的作用,被广泛的应用于图像处理的各个领域中。
中小学体育是中小学教育中最为基本的课程内容,很多学校普遍存在体育课教学质量不高的问题.如何创新中小学体育教育方式,提升体育教学质量显得非常必要和重要.本文从创新中小
未来移动通信在传输速率、系统性能和系统业务容量等方面对无线通信系统提出了更高的要求。为了满足上述要求,LTE-A引入了CoMP(协作多点技术)技术,通过多个小区的联合处理,来
通信系统将允许多种类型的网络移动终端随时的加入和离开网络,这样的网络将很容易被攻击。任何在通信范围内的节点都可能窃听和截取信息。虽然现在我们有很多高安全性的加密
识字教学在小学语文教学中的地位非常重要,是提高小学生语文阅读能力与写作能力的基础.这也迎合了中国的古话叫做“人生聪明识字始”,也就是说,人的智慧、思维的拓展等都是建
随着通信技术的发展和人们对各种应用需求的不断增长,通信网络正经历着巨大的变革。可以预见,在未来几年里移动通信市场会维持高速增长的趋势。无论是2G网络还是3G网络抑或是即
自卸车是专用汽车中一个十分常见的品种,与我国的自卸车相比,国外的自卸车品种更多,应用范围更广,下面,让我们了解一下美国的自卸车。标准自卸车,标准自卸车(如图1)是最常见
分布式视频编码(DVC)系统是无线网络环境下视频压缩的良好解决方案,而随着理论研究的深入,如何实现一个硬件DVC系统逐渐成为人们关注的新热点。   本文详细介绍了一种变换域
学位