基于深度视觉特征的视频图像分类

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:guobaoling1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,以深度学习为代表的人工智能、模式识别领域相关技术取得了许多里程碑式的突破。这不但归功于研究者们在技术上取得的突破,还很大程度上受益于高性能计算资源的商业化以及平民化,使得更多的机构与个人可以参与到人工智能相关领域的研究。  深度学习相较于传统的机器学习,由于更加受益于数据驱动,在当前信息爆炸的大数据背景下,广泛受到研究者的青睐。而卷积神经网络,作为深度神经网络的一个典型代表,已经在计算机视觉领域取得了重要的成就。本文基于卷积神经网络,针对计算机视觉领域的基础问题—视频与图像的分类问题进行了研究与探索。主要取得的研究成果如下:  1.学习并改进了深度残差网络。该网络结构作为目前效果最优的卷积神经网络的代表,在学术和工业界都有很高地位。我们通过学习与研究残差网络的前世今生,提出修改了残差支路,以使得其可以在拓展表达能力的同时不会带来反向传播上的困难。我们在图片识别任务上进行了实验,结果表明该网络结构可以取得更高的识别准确率,并且在CIFAR-10,CIFAR-100两个自然图像数据集的图像分类任务的上相比残差网络均有性能提升。  2.我们很自然地从单张图片分类问题拓展到视频分类问题。对于视频分类问题,我们有侧重地研究了视频分类中比较重要的特征聚合问题,并提出了实体竞争网络,通过可学习权重来建模时间上下文实体之间的关系并对逐帧特征的响应值进行再评估。该网络是一种特征聚合的网络,在已经得到帧级特征的前提下,所提出的方法可以产生更加优秀的视频级特征。我们在UCF101,HMDB51以及ACTIVITY200数据集的视频分类任务上均取得更优的准确率,这也验证了我们模型的有效性。
其他文献
中国移动一级业务运营支撑系统自成立以来,规范了数据业务的传输机制,形成了良好的业务体系,主要由网络管理、系统管理、计费、营业账务和客户服务等部分组成,系统间通过统一
随着移动通信网络的发展和应用软件的丰富,智能手机已成为移动终端的发展趋势。智能手机配备了丰富的硬件接口和开放性的操作系统,为用户提供了一个功能强大的信息处理平台,但同
阴影是树木的重要视觉特征,它对提高树木绘制的真实感具有重要作用,同时阴影算法效率也是影响树木绘制效率的重要因素,因此树木阴影的快速生成和真实感绘制方法研究具有重要
近年来,随着互联网及其相关技术的飞速发展,搜索引擎成为人们从网上获取信息的有效方式之一。但是这些传统的搜索引擎存在着许多不足的地方,如相关性信息冗繁,检索结果不够精确,结
现代虚拟植物技术在树木的真实感绘制方面已经日趋成模拟方面的研究成果还不是很显著。目前树木的生长模拟已经成为当前虚拟植物研究的热点,其中以GreenLab模型的研究最为深
流体现象(如流水)是自然界中最普遍的一类现象,与人们的生活息息相关。如何结合流体现象的内在物理特征,依托计算机仿真技术和图形技术,生成可控的流体动画,一直是动画领域的热点
随着通信技术和多媒体技术的应用与服务越来越广泛,实时视频压缩编码技术成为非常重要的研究领域。运动估计是各类视频编码算法普遍采用的一项关键技术。它是上除时间冗余最基
H.264/AVC是由国际电信联盟和国际标准化组织共同制定的新一代视频编码标准。H.264不仅有着优异的压缩性能,而且具有良好的网络亲和性,这对实时的视频通信是十分重要的。因此
针对油藏数值模拟数据具有明显的地理空间特性,以往的MIS系统无法对这些油藏数据较好表达等问题,本文结合山东胜利油田科研项目,设计并实现了基于WebGIS的油藏模型显示分析系统,
为了提高空间相机故障诊断的效率,缩短故障诊断的时间,减少故障诊断的人力和物力,设计能集合多名专家的最佳经验,实现人机联合诊断的空间相机故障诊断专家系统。阐述故障诊断