基于迁移学习的建筑物识别技术研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户：wj3722858

【摘要】

：

【作者】

：

余林林

【出处】

：

浙江工业大学

【发表日期】

：

2021年03期

【关键词】

：

迁移学习卷积神经网络特征提取建筑物识别多角度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

如今的建筑物向着样式多样化,功能多样化演进,建筑物识别作为场景图像识别下的一个重要分支同时也是计算机视觉领域和机器人学领域的一个非常重要且极具挑战的研究内容.如何利用计算机思维使其能自动理解建筑物图像、并进行有效地识别,借机服务于大数据环境下的图像检索,成为了当下急需解决得难题。建筑物识别的一大关键技术在于特征提取,但是传统特征具有非常大的局限性,人为特征工程耗时耗力且对专业领域知识要求高,提取的特征较单一,且随着数据集复杂程度增加,图像中的冗余信息会变得愈加繁多,仅仅使用传统的机器学习方法无法很好的达到图像特征提取需求,近年来,随着深度学习技术的快速发展。基于端对端的神经网络结构凭借大数据及高维参数空间优势,从底层到顶层逐步抽象合成高级特征,数据驱动的自学习方式保证卷积神经网络具有优秀的特征抽取能力,因此将深度学习与建筑物识别结合起来并进行了相关的系统实现,表明具有实际的应用价值。同时本文主要完成了以下几方面工作:1)首先对建筑物识别进行相关工作介绍,对国内外的一些常用的方法和技术进行了阐述,并分析了目前建筑物图像别所存在的困难,再就场景图像识别领域中的特征提取这个关键步骤所采用的常用方法进行分析与总结。2)针对传统提取特征性能低,通用性差的问题,本文提出一种基于迁移学习的卷积神经网络图像认证模型Recog-Net。该网络提取的特征能够包含丰富的场景语义信息,该方法使用Incention-Net作为特征提取器,模型训练采用基于迁移学习的“预训练-微调模式”,通过Image Net对特征提取器进行预训练,将卷积网络到瓶颈层的部分作为特征提取过程。为了让模型能够更好的捕获特征之间的潜在关联信息以提高模型的预测精度,在此基础上又提出了一种多特征标定技术,通过对多功能建筑物进行人为特征界定,使通过瓶颈层以后的特征向量更具有表征性,在小样本数据集上得以应用。实验表明,多特征标定所获得的特征对比传统特征以及其它卷积神经网络结构学习到的特征,性能表现更加优秀,具有高度通用性、识别率以及抗鲁棒性,对目标数据域上建筑物图像的识别效果有很好的改善作用。3)考虑到不同建筑物图片其特征信息在空间中的分布大不相同,一幅建筑物图像中往往包含丰富的建筑物图像特征信息,同时夹杂着无关的背景信息,因此,如何从一幅建筑物图像中提取出关键信息量丰富的区域、忽略无关次要的区域对建筑物图像识别的准确度提升至关重要,为此本文又提出了一种多角度显著区域建筑物图像识别方案,该方案通过对建筑物图片进行大小尺度变换,对建筑物图像进行多尺度裁剪以获得具有丰富语义信息的区域位置(例如裁剪医院图片所获得的红十字特征对于医院识别效果就能大大提高),同时对于无关的图像信息(例如图片中的花草树木等)进行丢弃,然后将多尺度图片送入Recog-Net.形成多角度特征,并替换分类器为SVM进行分类,实验表明,多角度显著区域的图像特征提取对图像识别率提高有很大的影响。

其他文献

分数阶时滞微分不等式及其应用

本文致力于研究带有时滞的分数阶微分不等式,并将其应用到分数阶时滞系统的稳定性理论的研究当中。本文分为以下四个部分:第一部分研究了线性常系数的分数阶时滞微分不等式,

学位

分数阶时滞微分不等式分数阶时滞系统稳定性M-L稳定

支持查询的大规模RDF数据压缩方法研究

随着语义网技术的飞速发展,RDF数据迅速增长,这给RDF数据的存储与传输带来了巨大的挑战。现存的通用压缩技术和RDF专用压缩技术可以在一定程度上解决该问题,但大规模数据中连接主语的谓词冗余仍未得到很好的解决,此外针对压缩数据的查询仍然存在数据压缩比率和数据查询效率相互制约的问题,二者性能的同时提升仍需进一步研究。本文针对连接主语的谓词冗余这种可被优化的数据冗余,提出基于差分编码的RDF分组压缩算法

学位

语义网资源描述框架数据压缩SPARQL数据查询

OxyR2调控的烷基氢过氧化物酶AhpC对霍乱弧菌抗氧化胁迫能力的影响

霍乱是一种流行性的肠道感染疾病,人体感染后会引起剧烈的水样腹泻、脱水痉挛、甚至死亡等症状,该疾病传播快、病死率高,至今仍是发展中国家人民生命安全的巨大威胁。霍乱弧

学位

霍乱弧菌活性氧AhpCPrxAOxyR定殖

裂缝性储层缝内人工暂堵条件下裂缝扩展规律研究

我国致密油气资源十分丰富,已成为国内能源供应的重要组成部分。目前国内外针对裂缝性致密油气藏开发通常采用缝内暂堵转向压裂技术以形成复杂裂缝网络,沟通近井区域油气富集

学位

裂缝性储层缝网压裂缝内暂堵裂缝扩展复杂裂缝网络

非线性光学成像在生物和材料中的应用

非线性光学成像可以实现对样品的无标记和无接触的成像,同时又具有空间分辨率高、层析成像和穿透深度大等特点,凭借优异的特性使其在生物医学、生命科学、材料科学等领域研究

学位

非线性光学成像骨组织多孔碳花粉

基于模糊邻域的肿瘤特征基因选择方法研究

在生物医学方面,利用DNA微阵列技术可获取大量的基因表达谱数据,通过数据分析,构建有效的肿瘤分类模型,对肿瘤的临床诊断和治疗具有重要的研究意义和应用价值。现今已获得的

学位

特征基因选择模糊邻域粒模糊邻域条件熵模糊相似关系粗糙不确定性度量

深水钻井井筒中泡状流下水合物形成机理研究

在低温高压环境下水合物的形成不仅会影响钻井液的流变性,增大摩阻压降,还可能在管壁上沉积,甚至进入连接器内的空隙,堵塞防喷器和节流压井管线,给井控和钻井作业带来严重威

学位

泡状流传热传质水合物生长生成速率上升速度粒径分布

隐匿身份侦查的立法完善研究

隐匿身份侦查是刑事侦查实践中经常使用的一种特殊的侦查手段,在侦破多发性、复杂性、团伙性、集团性组织犯罪等案件中发挥着十分重要的作用。而长期以来,隐匿身份侦查只是由侦查机关的内部规定进行规制,缺乏有效的外部监督和制约机制,侦查机关拥有绝对的自我决定权,完全游离于法律之外,容易导致侦查权的肆意滥用,对公民的合法权益造成严重侵犯。2012年修订的《刑事诉讼法》首次将关于隐匿身份侦查措施纳入法律条款当中,

学位

隐匿身份侦查特情侦查诱惑侦查卧底侦查法律监督

基于声信号特征分析的出砂监测方法研究

适度出砂是一种有选择、有限度的防砂,让油井以尽可能高产而又不会使地层塌陷,不会对生产设施造成过大伤害的生产策略。要实现适度出砂生产,就必须将油井出砂控制在合理范围

学位

适度出砂声传感器聚焦装置安装位置声信号特征

脱离源语语言外壳策略的应用

在当今这样一个全球化的社会中,各种跨文化交际越来越普遍。交替传译作为一种连接不同语言文化的桥梁,对促进各种交流活动起到了至关重要的作用。译员通常需要能够迅速并且有

学位

研讨会交传脱离原语语言外壳口译策略

基于迁移学习的建筑物识别技术研究

与本文相关的学术论文