基于视频样本分类的事件库构建方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:AsiaITt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的视频检索都是基于视频人工标注的关键字检索,但是当视频的数据量非常大的时候,需要消耗的人力会急速的增加。因此采用了一种基于视频样本分类的事件库构建方法。基于语义内容视频事件库建立的主要目的就是对一段视频的主体目标和事件语义进行识别。视频的高层语义内容比较直观,要对其进行识别需要建立一个其与底层特征之间的对应关系。视频由一系列连续的图像帧组成,而视频的主体目标可以选取几帧具有代表性的帧来识别,这些具有代表性的帧被称为关键帧。SURF描述子代表了帧的特征点,当视频中出现变化较大的画面时相邻帧之间的匹配特征点的数目也会急剧下降,因此根据SURF描述子的匹配率来识别出视频的关键帧。视频相比较图像多了时间上的连续性,而视频主体目标的轨迹数据能很好的反应出视频在时间上的连续性,因而采用运动目标轨迹数据提取常用的方式(通过混合高斯模型识别出视频的对象,然后采用Came Shift算法提取出对象的轨迹数据)。视频关键帧和主体目标的轨迹数据没办法直接对视频事件进行识别,关键帧能反应出视频主体运动目标对象,因此提取出视频关键帧的底层特征向量后对视频主体对象做一个初步的分类。通过观察发现视频复杂场景下视频关键帧的数量和关键帧内背景目标有很大的差异,因而采用了基于视觉单词的词频向量对视频的场景语义做了一个聚类。轨迹数据没办法直接用来识别视频事件,提出了一个七维向量来量化一段轨迹数据和每一维向量的权值计算方式。不同的视频往往提取出的轨迹数据的数量不同,因而提出了一种基于不同轨迹数据数量的视频之间相似度计算方法。最后在对视频测试样本数据集采用K最近邻算法对视频语义进行预测,当事件库中的视频数量过大时,跟每一段视频进行比较花费时间过多,因此采用了随即抽样对事件库中的视频进行不完全的比较,实验结果显示两者预测准确率在同一水平线上,但是速度能得到很大的提高。
其他文献
神经网络泛化能力是影响其可用性的重要方面,如何提高泛化能力日益受到关注。一种普遍情况是一些神经网络在训练阶段能够取得很好的训练精度,但在实际应用阶段却产生了较大的
空间曲线的旋转最小标架在计算机图形学、计算机动画等领域受到广泛的关注。旋转最小标架在扫曲面建模、三维漫游、运动插值等方面有着重要的应用。由于空间曲线的旋转最小标
RDF作为语义网框架的一项核心概念,因其表达灵活、方便的特点,常被用来表示结构化或非结构化数据。越来越多的RDF数据,为大数据分析提供了数据资源,使得专家学者们开始研究分
电子商务的发展以Internet信息系统为基础,其环境具有开放性,网络欺诈现象不可避免,信任模型的研究便成为热点。对参与交易活动的实体进行信任评估,既可以降低交易风险,又能
随着教育部对教学信息化的支持,课程中心的建设受到广泛的关注。通过调研国内排名前50的大学,70%的高校仍未完成课程中心的建设。而在已完成的课程中心中,存在着网络课程资源
随着互联网技术的不断发展,P2P己经成为发展最迅猛的网络应用之一。据权威机构统计,P2P业务已悄然占据了互联网业务总量的60%-80%,成为消耗互联网宽带的杀手级应用。然而,还
传统的“尽力而为”机制已不能满足用户的需求,由此,面向服务质量的网络体系结构应运而生。因而为了获得更高的服务质量,本文提出了基于QoS的网络拓扑结构优化模型QoS-OSM。Q
随着网络的不断发展,信息的交流越来越广泛。针对以往C/S和B/S模式下的客户端软件效率低的问题,提出了高效率、可移植性的富客户端概念。以富客户端软件设计为实例,分析了基
学位
CT诊断报告是放射科医生对CT图像结果的客观描述。随着计算机辅助诊断系统的发展,CT图像中肺部疾病辅助诊断已经在很大程度上减少放射科医生的工作量以及单独阅片的疏漏,进而
随着社交网络的快速发展,微博受到了越来越多用户的关注。为方便用户从这些海量的数据的发现与特定主题和事件相关的微博,大部分社交网站中都包含一些主题标签。一方面,主题