图像识别中的特征表达方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wangxiaoyuzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别是计算机视觉领域的核心分支,它集成了数字图像处理、模式识别和机器学习等学科知识,是图像检索、图像标注、人机交互和智能视频监控等应用技术的基础。特征表达是图像识别研究的关键点,也是难点所在。本文以场景图像分类和物体识别为研究任务,从紧凑性、语义性和判别性出发,对图像识别中的特征表达进行了深入的研究,主要研究内容和贡献包括:  提出了一种结合空间结构信息的特征紧凑表达方法。传统的词袋模型需要在特征汇聚阶段采用空间金字塔模型来补充空间信息,然而空间金字塔模型的特征维数随空间划分层数增加呈指数增长。针对这个问题,本文中提出在表观特征描述子上串联空间特征描述子的方式,只采用传统的词袋模型就可以提取图像多尺度的空间信息。具体地,定义了三种空间特征描述子,并且从多规模词典学习的角度解释了空间金字塔模型存在信息冗余的原因。在两个公共数据集上的实验结果表明,本文提出的方法无论在特征表达的紧凑性上还是判别性上皆优于空间金字塔模型。  提出了基于Boosting的特征自适应汇聚(Pooling)方法。传统的汇聚方法大多是启发式的,不能充分利用图像的判别性空间信息。本文提出了一种自适应的空间汇聚方法,将汇聚参数化成矩阵的形式,并联合分类器统一建模。通过这样的方式,可以学到更灵活的汇聚函数(不只是均值汇聚和最大值汇聚)、提取更多样的空间结构(不只是规则的矩形区域)。且不同于现有方法中所有类别共享汇聚操作的做法,本文通过判别学习为每个类别学习特有的汇聚方式,充分利用了图像的空间判别信息。算法的有效性在三个场景图像数据集上得到了验证。  提出了一种判别多类学习的CNN特征汇聚方法。现有研究结果表明,将大规模数据库上预训练得到的CNN模型直接用于通用的小规模图像识别数据集的特征提取,性能显著优于传统的基于人工特征的方法。然而直接采用全连接层输出特征作为图像表达存在空间结构信息利用不充分等缺陷。针对该问题,本文利用空间结构信息丰富的卷积层特征图,结合重定向的最小均方回归模型学习判别的多分布加权汇聚。实验结果表明,本文提出的方法和CNN全连接层特征具有很好的互补性,将二者结合生成特征,在多个数据集上都取得了最高识别性能。  提出了一种约束标签空间相似性的多源异构数据子空间学习方法。对于同一个分类任务,往往包含多种数据来源,借助标记样本丰富的数据源来辅助标记样本稀少的数据源,是多源异构数据分类的主要目标,但难点在于不同来源的数据特征维数和特征分布都可能存在差异。针对这个问题,本文提出了一种基于支撑向量机的子空间学习方法,不同于传统方法中约束特征空间相似性的做法,本文采用约束标签空间相似性的方式,充分利用了多源异构数据之间的相关性和判别性。该算法在文档数据以及图像数据上得到了有效的验证。
其他文献
传统的晶闸管感应加热电源,一般用复杂的三相桥式相控整流调节并联谐振逆变器输入电压从而调节功率,这种电路有网侧功率因数低,动态响应慢,不能达到较高频率,开关应力大等缺
随着海量高分辨率遥感图像数据的出现,如何快速有效地从遥感图像中提取人们所需要的信息已经日益成为一个迫切的问题。其中遥感图像机动目标检测在很多应用中有广泛需求,如军事
该课题的主要工作就是利用数字图象处理技术研究和开发汽车牌照自动识别系统.由于车牌识别的复杂性特殊性以及相关资料与文献的缺乏,作者深入广泛地研究了现有的一些效果好的
该文以挖泥船为研究对象,提出采用自控频率调速系统对泥泵的转速进行控制,并对此系统建立模型、进行工程设计,对系统的性能进行仿真,使系统具有较好的动态跟随性和抗干扰性.
基于光学测量方法的三维曲面轮廓测量技术,由于其具有非接触、高精度、易于自动控制等优点,日益受到人们的重视,广泛作用于机器视觉、三维造型、自动加工、工业检测及质量控
武器在现代战争中是非常重要的,是决定胜败的关键因素.ARM(Anti Radiaton-Missile)反辐射导弹作为现代武器的一种,其研制和发展越来越受到国内外有关研究人员的生视.该文详
该文首先对磁电式执行器的特性进行了研究,发现磁电式执行器具有严重的非线性和时变性.针对这样的特性,该文提出了Bang+bang+分段PI复合即将执行器的整个行程按其特性分段,分
精神分裂症是一种慢性的、严重的、功能障碍的脑疾病,至始至终都在影响着人类的健康。本文中,我们采用了一种联合分析手法:影像遗传学,将神经影像和遗传整合在一起,来研究精神分
该仿真系统详细分析了SPWM调制的原理,在此基础上,给出了SPWM序列的优化算法;通过对异步电动机的电磁原理的系统分析从而推导出了SPWM变频器--异步电动机调速系统的动态和动
该文在深入研究了灰色系统理论和方法的基础上,主要做了如下几方面的工作.传统的一些建模方法,只能建立离散的递推模型,不便对系统作全面的分析,更不能作长期预测,该文给出的