基于核可鉴别的分块稀疏表示视频语义分析研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:ddall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术和多媒体技术的飞速发展,视频数据也呈爆炸式地增长,如何对海量的视频数据分类分析成为一个亟待解决的问题。在对视频分析时,通常先提取视频低层特征,再根据提取的特征对视频分析,而人们习惯于用高级语义描述视频,这就产生了巨大的语义鸿沟,如何跨越语义鸿沟成为人们研究的挑战,稀疏表示方法的深入研究给解决上述问题带来了新思路。  本文针对视频特征的多样性和稀疏字典的冗余特点,提出一种基于核可鉴别的分块稀疏表示视频语义分析方法,并将该方法应用到对新闻视频分类中,主要工作如下:  (1)对视频的结构进行分析,并通过镜头检测分析将视频进一步分解,再从各个镜头中提取关键帧,并对关键帧进行特征提取,为语义分析做前期准备。  (2)提出了核可鉴别特征分块的稀疏表示方法。该方法根据视频特征独立性的特点,先将视频特征按照特征种类分块,再根据各种特征的维数大小分别建立其分块稀疏字典,并对每个分块字典在K-SVD算法基础上加入核可鉴别准则进行优化,使稀疏特征向量满足类内离散度较小、类间离散度较大的Fisher判别准则,且满足各种特征的稀疏表示特征具有更好的类别鉴别能力。该方法使稀疏字典的规模大幅度减小,同时加快了稀疏特征求解的速度。  (3)提出了多特征融合分析的视频语义分析方法。该方法先建立损失函数的计算准则,再根据准则计算测试样本与训练样本之间的损失函数值,结合改进的KNN算法对结果进行投票统计,然后根据类间特征的间距对统计结果的进行权重修正,使结果更准确,再根据各种特征对决策分析支持度进行融合特征分析,并输出分类的矢量标签。该方法在TRECVID2007所提供的新闻视频数据库测试表明,加入核可鉴别的分块稀疏化表示的视频特征分类分析效果更好,有效地提高了视频语义分析的准确性和分析速度。  (4)设计实现了基于稀疏表示的视频语义分析原型系统。该系统采用面向对象的设计方法,对系统的每个功能进行模块化设计,系统实现了视频预处理、关键帧提取、特征提取与分块、稀疏字典的优化训练和基于核可鉴别特征分块的稀疏表示视频语义分类分析,并设计了友好的界面和测试了整个分析系统运行的流畅性,验证了该方法的有效性和原型系统可用性。
其他文献
随着信息技术的发展,产生了大规模的网络数据,这为进行大规模的网络分析研究提供了充足的数据。近几年网络挖掘的研究迅速崛起,并发展成为一个很热门的研究领域。链接预测是
水声传感器网络是一个新兴的研究领域,可应用于海洋数据搜集、污染监控、近海勘探、灾难预防以及分布式战术监测等,有着广阔的应用前景。介质访问控制(MediaAccess Control,MAC)
声纳技术在海洋通信和水底探测等领域得到了广泛的应用,水声系统是声纳系统的重要设备。通常,水声系统由信号源、功率放大器、匹配网络和水声换能器四部分组成,网络匹配问题是水
在分布式系统中,对临界资源的访问是需要互斥进行的,所以分布式系统中最先要解决的问题是分布式互斥算法。分布式互斥算法主要分为两类,分别是基于竞争的和基于令牌的分布式
离群点检测是数据挖掘中的一个分支,它的任务是识别其特征显著不同于其他数据的观测值。在我们平常的社会生活和自然界中,大部分的事件和对象,都是很寻常或者是平凡的。但是
语音情感识别是情感计算研究方向的重要研究分支,它通过分析语音中情感的特征,进而识别语音中的情感状态。语音情感识别在翻译系统、航线监控系统、E-learning、移动智能终端等
工作关系网络、计算机网络等是较为常见且与日常生活密切相关的复杂网络。因此,网络中社团结构的探索和挖掘具备重要的实际意义。具有内部社团结构的复杂网络中,内部子社团节
软件缺陷数量是衡量软件质量好坏的一项重要指标,尽早地发现缺陷可以避免在软件开发后期为修改、弥补缺陷造成资源的浪费,保证软件的正常交付。软件缺陷预测模型可用于软件开
随着信息技术与计算机图形学技术的不断进步与发展,越来越多的学者致力于该领域的研究,其中植物建模就是该领域研究的热点之一。利用图形学技术生成虚拟植物,不仅要对植物的形态
查询扩展技术主要用于解决用户提交的查询不能准确描述其自身需求及检索意图的问题。早期的查询扩展技术主要以查询文档集作为扩展词的来源,如今,各种形式的外部扩展资源逐步