大规模图像检索和识别中的神经网络学习及其应用

被引量 : 0次 | 上传用户：moxiaomi521

【摘要】

：

在这个互联网时代，视频和图像主宰着信息媒体。互联网上的图像流量正在无界限地持续上升，例如2012年互联网上每天平均有2.5×1018字节的数据产生。这种大数据现象主要由视频和

【作者】

：

李金城

【发表日期】

：

2013年期

【关键词】

：

神经网络深层网络随机敏感度特征丢失图像分类大规模图像检索哈希

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在这个互联网时代，视频和图像主宰着信息媒体。互联网上的图像流量正在无界限地持续上升，例如2012年互联网上每天平均有2.5×10¹⁸字节的数据产生。这种大数据现象主要由视频和图像数据造成。然而，由于缺乏对上传到互联网的图像数据的控制，上传到互联网的图像的质量和内容千差万别，加上如传输错误、故意的或者意外的对图像主要内容的遮挡等都会造成图像内容的部分信息丢失。现有的用于图像分类和检索的神经网络学习算法仅依赖于训练样本容易遭受过拟合，从而导致泛化能力低。此外，海量的图像也使得用户从中寻找相关的图像变得越来越低效。为了解决以上问题，在这篇论文我们提出基于敏感度的神经网络学习框架。首先，一个基于随机敏感度度量（Stochastic Sensitivity Measure, ST-SM）的局部泛化误差模型（Localized Generalization Error Model，L-GEM）被提出来训练MLPNN。L-GEM衡量MLPNN在训练样本邻域内的未见样本的泛化误差。然后，我们提出基于结合ST-SM和随机特征删除的学习算法以克服图像分类中由于噪音等原因图像部分信息丢失从而导致分类性能剧烈下降的问题。另一方面，在MLPNN具有超过2个隐含层时，现有的激活函数在使用梯度下降的时候不能有效的传递误差到网络的深层。所以我们提出bi-firing激活函数来缓解深层网络的梯度漫射问题。大规模图像检索需要次线性复杂度的方法，哈希是一种有效的次线性方法，但是哈希通常返回大量不相关的图像。所以，我们提出一个基于敏感度的图像过滤方法以去除哈希返回的不相关图像以提高准确率的同时保持高的召回率。本学位论文主要做了以下四个方面的贡献：1)提出了一个随机敏感度（Stochastic Sensitivity Measure, ST-SM）作为多层神经网络训练的新惩罚项来达到更好的泛化能力。ST-SM衡量训练样本与训练样本附近的未见样本之间输出值之差平方的期望。ST-SM提供了一个直接衡量多层神经网络输出平滑性（复杂度）的度量。我们采用了基于Pareto最优理论的两阶段多目标方法同时最小化训练误差和ST-SM，以寻找最优的网络结构和连接权重。2)提出了一个具有很小饱和区域的可微激活函数以克服现有激活函数导致的深层网络梯度漫射问题。深层神经网络具有更强的表达能力。但是，随着隐含层的数目增加，现有的激活函数在使用梯度下降的时候不能有效的传递误差，从而导致性能差。现有的激活函数如sigmoid有很大的饱和区域。在这些饱和区域中，隐单元对输入的变化不敏感，从而导致梯度漫射。为了缓解这个问题，我们提出了双向发射激活函数（bi-firing）。Bi-firing激活函数是一个具有很小饱和区域的可微函数。3)提出了具有随机特征删除的敏感度度量正则化算法以抵御测试阶段图像由于特征丢失造成分类器性能的剧烈下降。像人脸识别和手写字符识别等物体识别应用，测试阶段被识别物体的部分信息丢失或者部分特征值丢失是常发生的。现有的正则方法没有考虑到这个问题，从而容易导致性能剧烈下降。为了解决这个问题，我们把局部泛化误差模型（Localized Generalization Error Model, L-GEM）推广到具有随机特征删除的情况（Localized Generalization Error Model with Random Feature Deletion,L-GEM-RFD）。L-GEM-RDF同时最小化训练样本和被删除掉部分特征的训练样本副本周围的一个小的邻域内的泛化误差，以同时容忍测试样本特征丢失和小的扰动的情况。4)提出了一个多哈希搜索图像过滤方法以权衡多哈希搜索的准确率与召回率。哈希是一种从大规模数据库中高效检索相似图像的技术，具有次线性（sublinear）的时间复杂度。但是，单个哈希表使用哈希查找的时候具有召回率低的缺点，多哈希表方法使用哈希查找能获得高的召回率但是准确率低。为了解决这个问题本文提出了一个基于敏感度的多哈希表搜索图像过滤方法（Sensitivity based Image Filtering, SIF）来去除不相关的图像以权衡多哈希方法的准确率与召回率。

其他文献

HJ公司商用空调开发项目成本管理研究

项目成本管理对项目的成功运行尤其重要，它从各个方面反映了项目组织的策略目标、任务说明和商业计划。成本管理（Cost Management）的定义包括数据收集、成本核算和成本控制，它需

学位

项目成本管理新产品开发商用空调

中国财政政策效应研究

自上世纪30年代“凯恩斯革命”开始,财政政策作为宏观经济管理的重要政策手段,不仅是经济学理论重要的研究领域,更是各国政府政策时间所使用的主要工具。1978年的改革开放以

学位

财政政策趋势分解财政支出效应区域差异农村居民消费

南水北调(中线)工程系统水资源优化配置研究探讨

分析了南水北调工程调水区和受水区的特点及其在跨流域水资源优化配置中的地位和作用;从沿线社会经济发展、水资源系统的工程和空问范围等角度,系统分析了南水北调工程沿线水

期刊

水资源优化配置南水北调系统分析

中国传统山水画论及造园理论中入画的植物经营

中国传统山水画和园林的融合艺术，在于“以画入园，以园为画本”。造园“入画”是历代造园者造园的出发点和评价标准，而植物这一造园要素，其经营要入画，自然也需要以画为依据，可是对

学位

山水画论造园理论植物经营种植设计入画如画

基于ZigBee单片机的智能照明系统的设计与实现

一个优秀的智能照明系统可以提升家庭环境的品质，确保家庭生活的舒适和健康，带动了人们生活方式的飞跃，由此带来的高品质生活正是消费者梦寐以求的。与此同时，绿色低碳环保等理念

学位

智能照明ZigBee技术传感器

HY公司招聘案例研究

随着经济的发展和全球竞争的加剧,当今的企业竞争已演变成为人才的竞争,企业要想在竞争中获得优势,就必须加强对人力资源的管理。招聘作为企业人力资源管理的基础,对企业的运

学位

HY公司招聘案例研究

两个分号引导的《拿来主义》修正解读

<正>《拿来主义》是高中语文的经典篇目,对它的解读是包括语文教师在内的教材研究者都十分重视的。在长期的教学实践中,基本形成了对经典篇目的经典解读,系统、全面、权威,

期刊

实用价值文化遗产比喻论证标点符号《拿来主义》

SG卷烟生产项目的柔性管理研究

中国作为全球最大的烟草生产和消费大国，吸烟人口数量、烟叶生产数量及卷烟生产数量都稳居世界第一位，中国的烟叶生产量约占世界总量的35%，卷烟产量约占世界总量的32%。同时，烟草

学位

项目管理柔性生产管理机制生产模式

基于DGA的变压器故障诊断算法研究

电力变压器作为一种能量转化的设备,在现代化电力系统中处于最核心的地位,它的性能直接影响着整个电力系统的安全可靠运行。因此准确掌握电力变压器的运行状态,对变压器进行

学位

变压器BP神经网络遗传算法支持向量机交叉验证

湛江供电局电力营销策略研究

随着电力体制改革的进一步深化和区域电力市场建设的全面推进，传统短缺经济情况下的电力市场营销观念和策略已经不能适应当前电力市场供求关系的变化。因此，树立以市场需求为导

学位

电力市场营销策略SWOT分析层次分析法模糊评价

大规模图像检索和识别中的神经网络学习及其应用

与本文相关的学术论文