基于Fisher Kernel的图像特征学习研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：liuxin87675241

【摘要】

：

在如今数据爆炸的时代,如何对数据进行有效的分类筛选,从而准确获取符合用户需求的有价值的信息成为人们面临的主要问题。在所有的数据类型中,图像是其中最常见的一种,且有着

【作者】

：

赵云浩

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2016年期

【关键词】

：

图像分析与理解特征学习 Fisher Kernel 卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在如今数据爆炸的时代,如何对数据进行有效的分类筛选,从而准确获取符合用户需求的有价值的信息成为人们面临的主要问题。在所有的数据类型中,图像是其中最常见的一种,且有着信息量大以及便于理解等特点,因而针对图像的分析与理解逐渐成为研究的热点。其主要的研究方向包括图像分类、图像检索以及目标识别等,它们有着各自不同的研究内容和口的,但相互之间也有所关联。由于图像数据量大及其非结构化等特性,几乎所有的图像分析与理解任务都不能直接在原图像上进行像素级的分类识别等操作,需要将图像表示为易于处理的特征向量。这种图像特征表达的好坏直接影响了图像分析与理解的结果,特征构建方法也由数字图像处理发展到特征学习领域,不同于前者的手工构建特征,特征学习是在给定数据集上进行监督或非监督的机器学习得到需要的特征表达。在众多的特征学习方法中,Fisher Kernel方法利用高斯混合模型在图像局部特征上构建特征码本,并通过求解模型上的对数似然梯度得到全局的特征表示,相对于其他模型在图像表达的全面性和判别性方面都展现了很大优势,同时,Fisher Kernel作为一类标准的特征学习框架在兼容性和扩展性方面都有着巨大的潜力。因此,基于Fisher Kernel的图像特征学习方法的研究具有重要意义。本文首先对基本的Fisher Kernel方法进行改进,引入多码本概念,提高视觉词之间的区分度,并根据不同尺度图像携带信息不同的特性,提出一种多尺度多码本的图像表达方法,得到效果更好的特征。另外,利用近年发展起来的卷积神经网络,提出跨卷积层池化的Fisher Kernel图像特征表达,充分利用了卷积网络的内在特性并融合了两者的优势得到新的特征表达。本文的主要贡献如下：(1) 由于基本的Fisher Kernel模型存在单一码本限制特征表达效果的问题,本文针对该问题提出多码本联合编码,利用码本间的差异化提供更加全面的特征表达,同时在输入端将不同尺度的图像与不同码本相对应,构建了完整的多尺度多码本图像表达体系,进一步提升了表达效果。(2) 将卷积神经网络与Fisher Kernel相结合,利用卷积神经网络来提取图像特征,并用Fisher Kernel对其进行编码得到图像表达。在此过程中,本文根据卷积网络的特性提出多空间单元的特征提取方法以获得更加全面的图像局部特征,以及跨卷积层的空间池化方法来代替传统的空间金字塔,为特征表达提供更准确的空间位置信息,这些都有效提升了图像表达的效果。

其他文献

异步无线传感网络广播效率的研究

广播路由将广播包分发至全网节点,在无线传感网中得到了广泛的应用,可以为诸如网络配置、代码更新、路由发现等一系列上层服务提供支持。为了减少能耗,传感器节点普遍采用异

学位

动态代理高效广播静态汇聚节点异步无线传感网络移动汇聚节点

基于PCM的B+-Tree索引的研究

随着科技的高速发展和大数据时代的到来，数据的存储需求和对响应时间的要求都在不断提高，仅仅从软件层面上解决存储问题比较困难，需要有新技术来摆脱磁盘的机械特性限制。近年来

学位

B+-tree索引读写倾向性非易失存储器优化算法

敏感图像关键部位识别研究

对网络敏感图像进行过滤的基础是对敏感图像进行识别,很多对敏感图像的过滤方法是基于依附于图像的文本信息或者URL地址,这些过滤技术缺乏对敏感图像识别的动态性和实时性,因

学位

敏感图像模糊C均值(FCM)邻域肤色分割多尺度

组合测试用例生成的禁忌搜索方法

随着计算机科学技术的不断发展，现代的软件功能日益强大，软件的复杂性也不断提高，对软件进行高效、可信的测试显得尤为重要。作为适应现代软件特点的新的测试方法，组合测试的概念

学位

组合测试用例生成方法禁忌搜索覆盖表参数配置策略

基于J2EE的卷烟厂数据采集管理系统的设计与开发

中国是目前世界上最大的烟草生产和消费国家,卷烟总产量占世界卷烟总产量的30%,同时烟草消费也占世界的1/3,烟草行业的利税占中国财政收入的1/10左右。随着市场一体化的不断

学位

数据采集管理系统J2EE设备维修决策支持系统

基于语义的视频检索

基于内容的视频检索(CBVR)是当前图像工程热点课题之一,它指根据视频的内容及上下文关系,对大规模视频数据库中的视频数据进行检索。可是人们习惯使用高层语义概念判断相似性

学位

视频检索语义对象视觉注意力语义提取模型

基于Symbian OS的P2P系统研究

随着中国3G牌照的下发,智能手机在中国越来越多。而近来大陆对WIFI的解禁,使在手机与互联网的关系越来越密切,手机与互联网有关的应用也越来越多。人们不满足于现有手机的使

学位

P2PBitTorrent文件共享Symbian

支持多终端切换的移动VoIP系统的设计与实现

随着通信技术的发展以及3G网络和移动互联网的大规模建设,目前有多种异构的无线通信网络在市场中共存,网络融合、终端融合及业务融合的需求变得更加迫切。实际应用中也需要一

学位

现代服务业移动性管理智能切换移动VoIP聚合

基于面绘制仿真内窥镜技术的研究

本篇论文综合讲述了仿真内窥镜技术的起源、思想、优劣、发展,并且对仿真内窥镜技术中所涉及的各种关键技术进行了深入具体的研究。传统的Marching Cubes算法是面绘制中一种应用最为广泛的算法,但是这种算法会产生二义性,并且计算效率也并不是很理想。本文应用渐近线判别法和移动四面体算法这两种方法解决了传统算法中的二义性问题,还提出了一种更为优化的改进MC算法。通过改进的算法,可以有效的节省传统算法在

学位

仿真内窥镜三维重建MC算法三角网格模型

面向服务机器人的行人检测与跟踪

随着人类逐渐从工业社会步入信息社会,信息化智能化的产品逐渐走进人们生活的方方面面。人口老龄化、人力成本的提高,使得社会对服务机器人的需求越来越迫切。行人检测与跟踪

学位

服务机器人行人检测与跟踪分层粒子滤波洪泛滥跟踪模型

基于Fisher Kernel的图像特征学习研究

与本文相关的学术论文