基于非线性可鉴别的稀疏表示视频语义分析方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:llllgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的迅猛发展和多媒体的广泛应用,多媒体技术已经成为人们研究的热点。而跨越视频底层特征与人类思维中的高层语义之间的语义鸿沟成为横亘在众多学者面前的亟待解决的问题,基于语义的视频检索技术应运而生。视频数据的语义分析和分类是基于语义的视频检索的主要研究内容之一。因此,研究快速而有效的视频语义分类方法至关重要。与此同时,在信号重建领域出现的稀疏表示理论的发展,也为视频的语义分析提供了可靠的理论依据和技术支持。   由于视频特征具有非线性的特点,结合稀疏表示理论,本文提出了基于核可鉴别字典优化的视频语义特征稀疏表示方法,并在此基础上提出了基于核可鉴别的视频特征稀疏表示语义分类算法,主要工作如下:   (1)提出了基于核可鉴别字典优化的视频语义特征稀疏表示方法。通过在K-SVD稀疏表示字典优化算法中引入核函数和类别矢量,提出一种新的基于核可鉴别的稀疏表示字典优化算法。该算法将低维空间中的视频稀疏表示特征映射到高维空间并使之满足类内离散度小、类间离散度大的Fisher准则,建立可鉴别模型。使用该模型对字典的优化求解进行约束,形成优化字典,并由该字典求解视频特征的稀疏表示。这种算法充分考虑了视频特征之间的非线性相关性,与传统K-SVD算法相比,本文算法所求解的稀疏表示特征更具有鉴别性。   (2)在利用基于核可鉴别的字典优化算法求解视频的稀疏表示特征后,提出了基于核可鉴别的视频语义分类算法。该方法利用训练样本的类别标签,在训练样本和测试样本上建立关于类别的分类准则,将核函数带入该准则中,形成基于核的分类鉴别损失函数,分别计算测试样本在各个类别上的分类鉴别损失函数值,根据分类鉴别损失函数值获得测试样本的预测类别标签。在TRECVID2007所提供的新闻视频数据集上的实验表明了基于核可鉴别的视频特征稀疏表示语义分类算法的有效性,分类准确率得到了提高。   (3)采用面向对象和模块化的设计思想,设计并实现了一个基于非线性可鉴别的稀疏表示视频语义分析系统。该系统实现了基于核可鉴别字典优化的视频语义特征稀疏表示以及基于核可鉴别的稀疏表示视频语义特征分类。通过原型系统的运行测试,验证了系统的有效性和可用性。
其他文献
随着我国改革开放的深入和全面建设小康社会目标的实施,我国的经济实力和居民生活水平得到了大幅提高,人员和货物流动空前活跃,使道路建设和交通管理日显滞后。机动车的拥有
作为智能的交通系统的基础之一,车载自组织网络的目标是为移动车辆节点提供一个移动的通信平台,能够提高交通的通信效率、降低事故发生率,使得乘客都能方便的、快捷的接入到互联
随着信息时代的逐步推进,科学工作流得到了广泛的应用。特别是在科研领域的应用更是广泛,如天文学,高性能物理学等。由于科学工作流需要的数据规模很大,为了执行科学工作流,
随着国家教育体制的改革,教育信息化对高校的信息化管理建设不断的提出更高的要求。但由于信息化建设的速度往往跟不上信息化发展的速度,导致出现了以下问题,一方面,在招生规
随着生命科学领域高通量实验的发展,人们得到越来越多有关蛋白质结构和功能的生物数据,生命科学的研究重点从解码基因组慢慢转变到对蛋白质的研究,进而探索生命进化的过程。蛋白
近年来,网络的社区结构得到了广泛而深入的研究。传统的社区发现算法针对的是数据间的关联特性,而忽略了数据的固有属性。然而,结合数据的社区特性和固有属性挖掘得到的离群点可
复杂网络遍布人类社会的各个领域,一般具有以下全部或部分特征:自组织、自相似、吸引子、小世界以及无标度等。社团结构发现是复杂网络研究中的热点。具有社团结构的复杂网络中
随着电子商务网站中商品数量和种类的增多,消费者需要花费更多的时间进行商品的筛选,这种信息过载的现象困扰着人们对有效信息的选择。为了解决以上难题,推荐技术进入了人们的生
颗粒粒度大小对于许多工业产品的质量和性能都起着非常重要的影响,基于嵌入式系统图像处理的颗粒粒度检测技术,因其具有便携性、安全、快速、非接触测量等诸多优势,成为目前颗粒
人脸识别技术是模式识别和人工智能领域的研究热点之一。基于二维图像的人脸识别技术经过半个多世纪的发展,已经取得了一定的研究成果。受限于所采用的数据形式,二维人脸识别方