论文部分内容阅读
如今的建筑物向着样式多样化,功能多样化演进,建筑物识别作为场景图像识别下的一个重要分支同时也是计算机视觉领域和机器人学领域的一个非常重要且极具挑战的研究内容.如何利用计算机思维使其能自动理解建筑物图像、并进行有效地识别,借机服务于大数据环境下的图像检索,成为了当下急需解决得难题。建筑物识别的一大关键技术在于特征提取,但是传统特征具有非常大的局限性,人为特征工程耗时耗力且对专业领域知识要求高,提取的特征较单一,且随着数据集复杂程度增加,图像中的冗余信息会变得愈加繁多,仅仅使用传统的机器学习方法无法很好的达到图像特征提取需求,近年来,随着深度学习技术的快速发展。基于端对端的神经网络结构凭借大数据及高维参数空间优势,从底层到顶层逐步抽象合成高级特征,数据驱动的自学习方式保证卷积神经网络具有优秀的特征抽取能力,因此将深度学习与建筑物识别结合起来并进行了相关的系统实现,表明具有实际的应用价值。同时本文主要完成了以下几方面工作:1)首先对建筑物识别进行相关工作介绍,对国内外的一些常用的方法和技术进行了阐述,并分析了目前建筑物图像别所存在的困难,再就场景图像识别领域中的特征提取这个关键步骤所采用的常用方法进行分析与总结。2)针对传统提取特征性能低,通用性差的问题,本文提出一种基于迁移学习的卷积神经网络图像认证模型Recog-Net。该网络提取的特征能够包含丰富的场景语义信息,该方法使用Incention-Net作为特征提取器,模型训练采用基于迁移学习的“预训练-微调模式”,通过Image Net对特征提取器进行预训练,将卷积网络到瓶颈层的部分作为特征提取过程。为了让模型能够更好的捕获特征之间的潜在关联信息以提高模型的预测精度,在此基础上又提出了一种多特征标定技术,通过对多功能建筑物进行人为特征界定,使通过瓶颈层以后的特征向量更具有表征性,在小样本数据集上得以应用。实验表明,多特征标定所获得的特征对比传统特征以及其它卷积神经网络结构学习到的特征,性能表现更加优秀,具有高度通用性、识别率以及抗鲁棒性,对目标数据域上建筑物图像的识别效果有很好的改善作用。3)考虑到不同建筑物图片其特征信息在空间中的分布大不相同,一幅建筑物图像中往往包含丰富的建筑物图像特征信息,同时夹杂着无关的背景信息,因此,如何从一幅建筑物图像中提取出关键信息量丰富的区域、忽略无关次要的区域对建筑物图像识别的准确度提升至关重要,为此本文又提出了一种多角度显著区域建筑物图像识别方案,该方案通过对建筑物图片进行大小尺度变换,对建筑物图像进行多尺度裁剪以获得具有丰富语义信息的区域位置(例如裁剪医院图片所获得的红十字特征对于医院识别效果就能大大提高),同时对于无关的图像信息(例如图片中的花草树木等)进行丢弃,然后将多尺度图片送入Recog-Net.形成多角度特征,并替换分类器为SVM进行分类,实验表明,多角度显著区域的图像特征提取对图像识别率提高有很大的影响。