基于稀疏表示的视频镜头分类方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:same66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的迅速发展,多媒体数据正以指数级增加。因此,如何从海量的视频中快速高效的检索出所需要的视频变得十分重要。基于语义的视频检索应运而生,其中对视频镜头加以分类是基于语义视频检索的基础性工作,因而,研究快速有效的视频镜头分类方法至关重要,同时稀疏表示理论的发展,也为视频镜头分类提供了强有力的理论支持和方法支持。   本文首先简要地介绍了课题研究的背景及意义,然后分析了基于语义视频检索及稀疏表示涉及到的主要工作的国内外研究现状。在此基础上,本文提出了新的基于稀疏表示的分类规则,基于类内平均欧式距离最小化及类间平均欧式距离最大化的稀疏字典优化算法。具体内容如下:   (1)提出了新的基于稀疏表示的分类规则。在以往的基于稀疏表示的分类中,通常选取样本与各类原型之问欧式距离最小的那一类作为最终的分类结果。本文中,为了克服上诉分类规则中可能存在的一些偶然性因素,充分考虑了样本与各类原型之间的欧式距离,即综合考虑样本与字典中所有类别原型之间的欧式距离,以此减少了特征分类时的偶然性。将该优化的稀疏表示分类规则应用于视频镜头分类中,提高了视频镜头特征分类的准确性。   (2)提出了基于鉴别性的稀疏字典优化算法。稀疏表示字典的好坏影响着最终的分类结果,因此构造一个优秀的稀疏表示字典是非常必要的。本文中,对于初始化后的稀疏表示字典中的每一个基元,考虑字典内基元类内平均欧式距离以及类间平均欧式距离,使得字典中各类包含的基元其类内平均欧式距离最小而类间平局欧式距离最大,使得同类之间的相似性更大以及不同类之间的差异性更大,提高了稀疏字典的鉴别性。将该算法用于视频镜头的稀疏特征求解,实验结果表明了可有效提高视频镜头分类的准确性。   (3)设计实现了基于稀疏表示视频镜头分类原型系统。采用面向对象的设计方法,设计并实现基于新的稀疏表示分类规则和优化之后的稀疏字典的视频镜头分类原型系统,并从实验角度验证上述方法的有效性。
其他文献
为了防范和查处招生考试中的替考舞弊行为,进一步保证考试的公平、公正,基于对河南省招生办公室现有的传统身份验证系统的分析,本文提出了基于DCNN的人脸识别技术在考生身份
随着因特网向社会各角落的渗透式扩张,各种新型应用模式的不断涌现,软件开发面临的挑战也越来越多:管理和维护成本逐步增加、运行与存储态方面的差异变得越来越明显等。自适应
目前,如何搭建一个高效的、智能的、网络化的交通管理系统就成为信息处理技术的一项十分重要的课题。因此,汽车牌照的自动识别问题已成为各级政府、交通管理部门和相关研究机
视频监控作为一个重要的安全防范系统,有着准确、直观、内容丰富等优点,越来越受到人们的青睐。目前该技术已经非常成熟且性能稳定,然而随着无线传输、图像处理技术的飞速发展,视
四边形网格由于其本身优良的性质在模型参数化、样条曲面、纹理贴图以及有限元模拟仿真等领域有着广泛的应用,因此,研究开发一个鲁棒稳定的四边形化系统有着巨大的工程应用价
随着计算机数字多媒体以及计算机网络的高速发展,计算机信息安全问题变得突出起来。信息隐藏是信息安全领域涉及统计学、人工智能、模式识别、密码学等方面的新兴交叉型学科。
3D打印技术是一种以三维数字形式立体构造物理对象的快速成型技术,它对世界各国的制造业产生重要影响,并被誉为引领“第三次工业革命”的重要技术之一。随着3D打印技术、计算
感知无线电技术允许感知用户伺机利用主用户的授权频段,可以提高频谱利用率,解决频谱资源匮乏问题。在感知无线电网络中,由于主用户重新出现,或者感知用户位置移动,或者网络条件发
分布式虚拟环境是将虚拟现实与网络通讯相结合,在一组以网络互联的计算机上同时运行虚拟环境的系统。随着网络技术的日渐成熟,虚拟环境中对象间的交互和协作需求不断的提高,
面向插件的框架开发方法在软件领域的应用较为广泛,特别是在较大规模的软件开发当中,对于软件框架统一模块化、减小模块耦合度、降低设计的难度,进而缩短开发周期以及提高软