基于卷积神经网络的视频分类检索

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zxw364963027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在图像识别领域的巨大成功,深度学习被应用到越来越多的领域,包括视频处理领域,文本处理领域以及音频处理领域。卷积神经网络是深度学习中非常重要的一类网络模型,它和传统神经网络的区别在于引入了卷积层、池化层。卷积神经网络在图像识别领域取得成功之后,研究人员开始逐步将其应用于视频分类任务中,并取得了分类效果上的提高,这充分说明了卷积神经网络在视频分类任务中起到的重要作用。本文的研究内容在于实现一个通用且有效的分类检索模型。在图像研究领域有研究人员提出在卷积神经网络中引入哈希层来得到图像对应的0-1向量哈希码,使用这个哈希码来进行相似图片的查找,取得了不错的效果。本文的一个创新点在于将这种思路引入到了视频处理领域,.验证了哈希层在这个应用场景中的有效性,继而提出通用且效果更好的分类检索模型;另外一个创新点在于采用了更为高效的检索算法来提高模型的可用性。本文在调研了相关领域的工作之后,采用了基于VGG-NET神经网络模型的视频分类模型,在模型中引入哈希层来得到视频对应的0-1向量哈希码。在模型对视频数据分类功能方面,通过实验验证了分类模型的准确率;在得到哈希码后的模型检索部分,本文提出的改进的检索算法和朴素的依次比较算法相比在检索时间上有显著地改进。总的来说,本文实现的通用分类检索模型具有更好的分类准确率和更快的检索速度。
其他文献
随着移动通信行业的不断发展和互联网向移动终端的普及,网络和用户对移动终端的要求越来越高。Android是一套真正意义上的开放性的移动设备综合平台,包括操作系统、中间件和关
《蒙古语语义知识词典》是一个以蒙语与英语的双语词语所代表的同义词概念集合为描述对象,通过语义关系的组织与联系,以揭示概念与概念之间以及概念所具有的属性之间的关系为
近年来,社会对政府公共服务的效率、质量、多样化和个性化的需求日益增长,伴随着居民卡使用数量的增加,信息共享显得尤为重要。因此,迫切需要建立居民卡公共服务平台,完善居
随着智能移动设备的快速普及以及基于位置社交网络服务(Location-based Social Networking Services,LBSNs)的快速发展,基于 check-in 数据挖掘的 POI(Point of Interest)推
扩频通信技术是将基带信号的频谱扩展至很宽的频带进行发送,在接收端将扩展的频谱恢复到基带信号频谱的一种通信方式。这种方式具有较强的抗噪声干扰和抗多径干扰性能,同时具有
在21世纪,公认的计算机发展的四项重大技术之一就是人机交互技术。人与计算机之间的交互方式逐渐开始适应人的行为习惯,从早期的以计算机为中心,逐步向以人为中心转移。手势作为
最近几年,伴随着高校校园网络技术和应用的快速发展,许多高校开始实施了办公自动化建设,并呈现出一定的发展趋势。据了解,不少高校都依照各自的需求及具备的软、硬件条件建立
云计算以便捷的按需服务的资源使用方式受到了各界的关注。云计算集群通过虚拟化技术将其上的资源提供给各个应用。但是云集群规模的增加以及应用的多样性都给云计算的资源管
随着近几年移动互联网的普及,电商行业飞速发展;平台入口流量增长迅猛,入驻服务商规模不断扩大。同时,很多ISV(independent software vendor,独立软件开发商)和品牌商的系统
与传统的分布式计算相比,移动计算系统具有一些固有特性,如移动主机存储空间小、能量低,无线网络带宽低以及无线连接易受干扰等。移动计算系统因为这些固有特性容易出现故障,如果