基于内容和语义的视频短镜头分类

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sukoo777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年来多媒体技术和网络技术的发展,网络上涌现出了越来越多的视频短镜头和在线视频网站,因此,基于内容和语义的视频短镜头的分类检索也成为了一个人们研究领域。视频短镜头是由时间上连续的帧图像组成的集合,因此对视频的分析包括空间和时间两个方面。空间上的分析,可以利用现有的图像特征提取技术,提取有效的视觉特征;对时间的分析,就需要对短镜头的数据进行结构化分析和处理。静态和动态特征的结合形成描述短镜头内容的特征空间。另一方面,由于传统的视频镜头分类系统没有考虑镜头的高级语义信息,这样导致了底层视觉特征和高层语义信息之间存在着语义鸿沟,因此在分类系统中加入对语义特征的分析和研究是十分有必要的,尝试由视频短镜头的底层特征推知高层语义信息,从而实现基于高级语义的镜头分类系统。因此,本文主要从以上两个方面进行了研究,并根据现有方法的特点和不足,提出了相应的解决办法。在提取了多种视频短镜头的视觉特征的基础上,采用互信息的方法研究单一的视觉特征的鉴别力,该方法理论基础强,不依赖于分类器的种类,从特征含类别的信息量的多少来分析特征的鉴别力,表达了图像特征与类别之间的内在联系,试验中基于SVM分类器的分类错误率也反映了使用互信息进行特征分析和选择的正确性和有效性。接下来使用SVM分类器,分析各种视觉特征之间的互补或冗余关系,从而进行最优特征组合的选择。研究确定的针对真人/动漫类别的最佳特征是RGB改进颜色矩+边缘动态特征的组合特征,针对人物/风景类别的最佳特征是RGB改进颜色矩+Gabor纹理特征+边缘动态特征的组合特征,针对体育/娱乐类别的最佳特征是边缘方向直方图+颜色动态特征。最后在针对球类比赛的视频短镜头分类系统中加入了高级语义特征的提取和研究,利用镜头内关键帧的比例和关键帧内球场区域像素比例的特征组合,将短镜头数据库分成场内和场外场景,利用球场区域的比例进一步将场内镜头分为远景和近景镜头,同时利用边缘区域的像素比例将场外场景分成教练员和观众镜头,从而形成了一种针对球类运动的分等级的短镜头分类器。
其他文献
可见光通信(VLC)与无线电通信组成的异构融合通信网络中,为了保证用户获得持续有效的通信服务,可见光通信与无线电通信垂直切换是研究重点。VLC采用强度调制/直接检测,易受遮
近年来,随着手机用户的快速普及和移动通信技术的迅猛发展,无线蜂窝网络逐渐完善。这使得利用完善的蜂窝网络经营一些要求比较高的增值业务变得可行,手机定位即是有待开发的
随着Web2.0的迅速发展,网络信息呈现爆炸式增长,如何从中快速准确地抽取用户感兴趣的信息成为当前智能信息处理领域亟待解决的问题。实体关系抽取作为信息抽取的核心任务和重
正交频分复用(OFDM)技术将成为第四代移动通信(4G)最关键的通信技术。OFDM技术具有抗多径干扰、抗频率选择性衰落强、频谱利用率极高的特点,本文主要通过对OFDM技术的每一细
随着移动互联网时代的到来,以微博为代表的社会化媒体成为热点信息传播的重要平台。同时,网络中活跃的大量水军用户受利益驱动,散布网络谣言与虚假信息,严重干扰正常的网络秩
IP协议,不仅应用于互联网,而且正在迅速成为所有无线系统网络层的普遍协议。如何保障信息在基于IP的网络中安全传输,成为人们日益关注的焦点。IPSec协议是网络安全方面最核心
现有的电信网和Internet因为自身的特点,都存在各自的局限性,不能完全满足现在的要求,从而促使它们向下一代网络(NGN)演进。这一演进过程是平稳过渡和逐渐融合的过程,也就是
本文结合多种P2P流量检测方法,创新性地提出了一套基于深度流检测的P2P流量识别方法,并在基于网络处理器MPC8572的硬件平台以及Linux-2.6.23的系统上进行了实验。 本文分析
随着社会信息化的不断推进,通信网络的宽带化成为一个必然的趋势。在这种需求的推动下,WiMAX和LTE应运而生,以各自特有的优势受到广泛的关注。WiMAX和LTE在采用的空口技术、
数据中心(Data Center,DC)已成为一种重要的信息通信基础设施,它采用虚拟化技术将海量的计算、存储、网络等物理资源高度整合为一个共享虚拟资源池,实现资源的高效共享。为了