基于数据挖掘的镜头分类技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:pw1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的视频检索是当前多媒体领域的研究热点。镜头分类,是基于内容的视频检索的基础工作。运动信息是描述视频的一种重要信息,是视频所独有的特征。运动信息有两种,全局运动和局部运动。全局运动代表摄像头的运动,局部运动代表视频里的目标运动。虽然人们一般更加关心视频里的目标运动,但是摄像头的运动也包含着重要信息,也是对视频中人物或事件变化的一种反映。为了实现镜头分类,首先必须区分全局运动和局部运动。 本文根据 MPEG 编码的特点,在传统自组织映射算法 (SOM) 的基础上,提出了多层次自组织映射算法 (MSOM)。通过采用多层次的神经网络,MSOM 解决了传统 SOM 算法在有冲突的情况下,造成分类误差的问题。为了进一步提高算法的执行效率,通过引入主成分分析方法 (PCA),本文提出了基于主成分分析的多层次自组织映射算法 (MPCA-MSOM)。MPCA-MSOM 算法在保持较高识别率的同时,大大降低了计算复杂性,提高了执行效率。 仿真实验的结果表明,相对于其它同类算法,MSOM 和 MPCA-MSOM算法提高了分类的识别率,在利用运动信息的镜头分类中有更好的效果。
其他文献
随着计算机技术和网络技术的发展,以视频会议、计算机协同计算以及大规模分布交互仿真等为代表的组通信应用不断涌现,这些组通信应用迫切需要 Internet提供更好的服务。为了适
三维图形技术是虚拟现实、实时仿真以及交互三维设计等许多重要应用的关键技术。由于三维图形技术涉及到许多算法和专业知识,要快速的开发三维应用程序是有一定困难的,因此三维
随着计算机技术与图形学的迅速发展,作为两者结合产物的计算机动画也随之发展并渗透到人们生活的各个领域:游戏、广告、医学、教育及军事,成为一个具有数百亿美元年产值的行
作为信息时代的重要标志之一,Internet上的万千信息,给人们的工作、学习、生活带来了极大便利。但在信息的海洋中,还夹杂着一些不良内容的浮渣,它们给社会带来相当大的“不良信息
竞争领域中的决策问题是人工智能领域长期研究的问题。现有的决策方法仅仅模拟了人类决策的一个方面:人类在自身熟悉的领域中往往可以根据以往的竞争经验做出迅速、准确的反应
目前,全球集群通信系统正从模拟集群向数字集群转换。与传统的模拟集群系统相比,数字集群系统可以提供丰富的业务种类、更好的业务质量和保密特性、以及更高的频谱效率。数字
目前,嵌入式视频监控系统已成为国内外视频监控系统应用的主流,但是在IPv4平台下存在地址不足、不能合理分配带宽、安全性能及移动性能差等诸多问题,而新一代IPv6协议不仅能
随着计算机技术和网络技术的发展对存储系统提出了越来越高的要求,面向对象存储系统(Object Based storage System,OBS)是适应于下一代互联网环境的新型网络存储技术。OBS由
随着Java技术的不断发展,Java图形用户界面的开发受到越来越多的关注。Sun为了克服以往在图形界面外观设计上的复杂性,在JDKI.5中引入了Synth——可切换皮肤的外观。Synth针
入侵检测是一种用于检测计算机网络系统中入侵行为的网络信息安全技术,目前已成为网络安全领域中的重要研究方向之一。以机器学习为基础的异常检测技术,通过对样本的学习分析检