感受野学习模型、方法与应用研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:parabird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检测与识别任务的性能很大程度上取决于特征的表达能力,好的特征应该能丢弃无关信息,并将图像中与任务相关的要素充分的抽象出来。传统的描述子受到表达能力的限制,成为图像检测与识别任务中的瓶颈。而近年来迅速发展的特征学习模型能够从数据中学习图像的特征,将图像检测与识别算法的能力推向了一个新的高度。在特征学习算法中,通过对特征的池化(pooling)操作,可以生成一个更有效、包含了重要信息的新特征,同时抛弃一些无关细节。池化能够使特征产生一些较为复杂的特性,因此有研究者也将特征学习模型中的池化,与哺乳动物复杂视觉细胞相对应。在神经科学中,这些复杂视觉细胞对于输入信号的响应具有局部性、带通性和选择性,上述性质也被称作复杂视觉细胞的感受野。本文的主要工作,围绕面向图像检测和识别任务的特征学习展开,旨在通过对池化模型的改进,进一步地提高特征的表达能力。一些研究者将池化模型上的学习方法称为感受野学习。本文对特征词袋(Bag-of-features,BoF)模型和卷积神经网络(Convolutional Neural Networks, CNN)模型上的池化展开研究,主要工作和贡献包含以下四个方面:1)提高BoF模型的池化特征对于特征图(feature map)局部空间统计信息的表达能力。首先,通过对于已有池化方案的分析,提出一种空间相似度低的池化区域方案,降低由于空间区域相似导致的特征冗余。其次,对于含有不同特征数量的池化区域予以区分。含有特征数量较多的池化区域,采用多种聚合运算来生成多个池化特征。最后,在这些池化特征上使用Fisher核方法,将其在特征空间的分布信息考虑在内。这些低冗余、局部统计丰富、包含特征空间信息的池化特征,能够提高特征的表达能力。2)解决BoF模型在分类任务中包含过多的冗余视觉单词和池化特征(pooled featue)的问题。针对此问题,本文提出两种解决方案:第一种在Jia等人的感受野学习算法基础上,对于分值函数进行改进,使学习过程能够尽可能地选择已使用特征图上的池化特征,从而减缓特征图数量的增长,达到简化BoF模型特征词典规模和池化特征数量的效果。第二种方案则是在第一种方案基础上,进一步将视觉单词和池化特征的选择分为两个阶段,首先确定重要性较高的视觉单词,然后选择这些视觉单词产生的特征图中的池化特征。3)提出在全局池化(global average pooling)层学习目标显著性特征的方法,并在显著性响应的特征图上利用结构信息定位人脸池化区域,形成一个以CNN为基础的人脸定位与识别的多任务模型。首先,在训练中使用负样本对于非人脸区域产生的响应进行抑制,使学习到的特征仅对于人脸区域产生响应,获得关于人脸的显著性。显著性学习能够抑制背景的干扰,提高特征表达在不同数据集的适应能力。其次,不同的特征图之间的显著性响应存在结构性。为了充分利用这些信息实现对于人脸的定位,本文使用基于部件(part-based)的方案设计模型。改进后的模型能找到更加合适的池化区域,从而具备一定的人脸对齐功能。最后,将显著性学习和人脸定位过程作为一个完整模型进行联合训练,使特征学习与人脸定位相互适应。4)提高基于区域神经网络方法(Region-based Convolutional Neural Networks,R-CNN)中候选区域的有效性。首先,将显著性学习同基于区域的方法相结合,利用显著性所提供的目标局部性信息、上下文信息和部件之间的结构信息,对候选区域进行评分,仅保留那些评分较高的区域。其次,对于检测任务中存在整体与部件关系的目标,由于部件之间的高度重叠和相关,使得RPN (Region Proposal Network)区域提取时会产生歧义,削弱候选区域的有效性。本文采用多任务分支来消除候选区域提取时的歧义问题。最后,提出模型参数裁剪的方案,在模型中仅保留那些重要性较高的部分。对于规模较小的检测问题能够有效地提高检测效率,并保证检测精度。
其他文献
对于法律权威及其重要性,古今中外的思想家们有过不同程度的探讨。作为杰出政治家、中国改革开放总设计师的邓小平,从解决中国的实际问题出发,在总结国际共产主义运动的经验
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在公司治理中,我们有各种各样的公司分类。如按规模分为大、中、小公司,按资本来源分为国有企业、民营企业、股份公司,按行业类别则有能源公司、化学企业、汽车公司等等。不
目的:烟雾病的发病率较低,临床表现多种多样且缺乏特异性,如不提高对本病的认识及进行脑血管方面的相关检查容易出现漏诊及误诊。对本病的早发现、早治疗可以有效延缓其临床
目的评价模板辅助192铱源大分割立体后装放射消融术(SABT)在可手术周围型非小细胞肺癌新辅助治疗中的临床效果。方法收集经病理证实的可手术周围型非小细胞肺癌初治患者,给予
在3E150柴油机上采用双喷射系统及闪急沸腾喷射技术进行了燃用煤液化燃料的试验研究,结果表明,对煤液化燃料加热使之在缸内形成闪急喷射可大大改善柴油机的燃烧状况。
日前,国务院通过了《高职扩招相关工作实施方案》,我国将大力推进高职院校扩招,扩招人数高达100万人次。大量生源的涌入必然会对高职院校的师资队伍建设工作带来挑战。为此,
面对愈演愈烈的生态危机,生态批评应运而生。它旨在通过对文学文本中人与自然关系的考察探究生态危机产生的思想根源,并期望通过对这些错误根源的批判最终实现人和自然的和谐
目的调查分析我院肿瘤科癌症患者化疗辅助药的使用情况,为促进临床合理用药提供依据。方法采用回顾性分析法,统计并分析2016年化疗辅助用药的用药频度(DDDs)、药物利用指数(D