基于多视觉特征的航拍场景分类

来源 :安徽大学 | 被引量 : 0次 | 上传用户:cstmddn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过不同遥感平台获取的多源遥感影像为对地观测提供了丰富的数据源,通过影像解译可获取大量的地理数据和空间信息,在农业、林业、生态环境等领域中发挥着重要作用。“场景分类”作为理解遥感影像的重要方式之一,成为遥感影像分类研究中的热点。随着航空遥感技术日渐成熟,其成像方式灵活、空间分辨率高等优势,为场景分类提供了丰富的数据源,但也面临数据量大、运行时间长、分类精度不高等挑战。本文采用基于低级和高级视觉特征的分类方法,并在UC-Merced和AID两个主流的航拍影像场景数据集上测试,对比分析两类方法的表现。主要研究内容如下:(1)采用一种结合颜色与纹理特征的场景分类方法。首先利用基于HSV空间中的颜色直方图(HSV-CH)、局部二值模型(LBP)和梯度-灰度共生矩阵(GLGCM)三种特征描述符解译图像的颜色和纹理信息,然后将提取的特征堆叠成新的特征向量,最后将标准化后的新特征向量输入到四种常见的分类器(SVM、KNN、RF和LR)中进行训练,得出整体精度,比较几种分类器模型的结果,选出最佳的组合模型。在UC-Merced和AID两个航空场景分类数据集上对该最佳组合模型进行了验证。在随机选取数据集中80%的样本量作为训练集的情况下,UC-Merced数据集的最高总体精度OA达到了86.48%,而AID数据集在训练集为50%样本量的情况下,最高总体精度OA也有75.34%。两个数据集的实验结果都表明,本方法较SIFT、Color-HLS、LBP等基于低级视觉特征的方法相比有一定程度上的提高,甚至好于Bo VW、IFK等依赖中级视觉表征的方法。因此,本分类方法有效提高了仅基于低级视觉特征的航拍场景分类性能。(2)采用一种基于AlexNet-CBAM网络的航拍场景分类方法。在经典网络AlexNet的原模型上进行改进,将原模型中的局部响应归一化(LRN)层和Re LU激活函数使用批归一化(BN)层和h-Swish激活函数进行替换,并加入卷积块注意力模块(CBAM),使网络模型在通道和空间两个维度上关注重点信息。新的深度学习模型AlexNet-CBAM的具体结构通过在WHU-RS19数据集上的实验确定,并将最终确定的AlexNet-CBAM模型在UC-Merced和AID两个数据集上进行实验验证。数据集在进行实验前会进行一些简单的预处理工作来增加样本量。之后,再和两个经典的CNN网络:AlexNet和VGG-16,进行对比论证。实验结果表明,AlexNet-CBAM模型解译场景影像的有效性相较于其他两种经典网络有所提高。在UC-Merced数据集上,AlexNetCBAM模型的测试准确率达到了98.64%(测试与训练的样本比例为2:8),比AlexNet高出4.24%,比VGG-16也要高出1.89%。该模型在AID数据集上的实验结果也达到了94.08%(测试与训练的样本比例为5:5),相较于AlexNet和VGG-16两个经典模型的准确率分别高出7.26%和4.84%。综上所述,基于低级视觉特征分类方法与基于高级视觉信息分类方法在相同数据集上的表现有所差异。对于UC-Merced数据集,第一种方法的总体精度为86.48%,第二种方法分类精度达到了98.64%,比第一种高出12.16%。同样在AID数据集上,前者的分类精度要低于后者,分别达到75.34%和94.08%。虽然基于低级视觉特征分类方法的有效性与基于高级视觉信息相比较差,但前者在某些方面也占有一定优势,例如时效性强以及对硬件的要求低。CNN模型中有数以千万计的参数参与训练,其训练花费的时间是机器学习的几十倍。且CNN性能的优劣在一定程度上依赖数据样本的规模以及模型的复杂程度,而数据样本规模越大、网络模型越复杂,对于运行实验的硬件要求就越高。
其他文献
光热电(Photo-thermoelectric:PTE)器件作为一种新型的能源器件,能够很好的满足光电探测器和便携式电源的需求,并在红外光及太赫兹探测领域展现出了广阔的应用前景。然而,传统的PTE器件仅对红外光有光响应信号,在能量较高的可见光范围缺少光响应信号,这一缺点极大限制PTE器件对太阳光的利用能力。同时,通过我们研究发现,PTE器件对气流的波动会产生较强的电信号波动,因而在气动传感方面展
学位
自忆阻器成功研制以来,就不断应用于多个领域。随着对忆阻混沌系统的深入探索,发现经过忆阻器串并联构建的电路表现出复杂的动力学行为,但是其忆阻器之间的耦合效应同样也是不容忽视的。同时,由于分数阶理论具有能够精确刻画现实事物本质特征的优势,这使得研究者们考虑将耦合忆阻系统的研究从整数阶转向分数阶。此外,相对于传统的伏安模型而言,韦库模型中初始值可设置为单独的参数,这为研究耦合忆阻混沌系统的初值敏感性提供
学位
由于近些年信息技术的蓬勃发展,使得机器学习在重症医疗领域的研究日趋重视。但是传统的重症数据库仅限于病例管理,并不具有空间地理数据信息和疾病的预诊评估,无法应对重症的紧急性和突发性。新型冠状病毒的到来,更是突出了这一缺陷。近年来随着WebGIS技术的快速发展,本文通过查阅相关文献以及相关开发技术,对目前的主流技术方案进行了介绍,根据现有的数据,通过收集研究区的医疗资源信息以及相关基础地理和医疗资源数
学位
生物医学图像配准(Bio-medical Image Registration,BIR)在医学成像、生物医学基础研究及临床辅助诊疗中发挥重要作用。3D生物医学图像配准旨在建立3D图像对之间体素级别的非线性映射关系。传统基于特征优化的BIR算法取得较大进展且配准精度高,但是其针对特定图像对的迭代优化过程十分耗时无法满足临床实时应用的要求。近年来,深度学习(Deep Learning,DL)技术飞速发
学位
农业在一个国家的经济发展过程中起着战略性作用,对于发展中国家的经济稳步发展至关重要。由于农作物病害而引起的农产品减产减收是农业经济发展的一大障碍,为了解决这一障碍,对于农作物病害的及时防治尤为重要。准确且高效的识别农作物病害是进行病害防护治理的前提条件,对农作物的产量和品质有直接影响,因此如何更加高效并且精准的对农作物病害进行识别对于农业生产具有重要意义。在过去,一般通过农作物病害专家对发病作物进
学位
随着当今医疗技术的进步发展,大多数疾病都有了解决方案,人类平均寿命延长,人口年龄分布已经趋向老龄化。与此同时一种新的群体“空巢老人”也随之诞生,依据全国老龄办公开报道,2020年空巢老人人口总数现已达到了1.18亿。由于这种群体的特殊性,在缺少照顾的情况下,身体不便带来的危险也随之增加,国内65岁以上的老人因伤意外离世的最主要的因素便是摔倒,随着年龄的增长,摔倒后发现不及时从而导致的危险尤其严重。
学位
在爆破行业蓬勃发展的同时,电子雷管和起爆终端被广泛的应用,行业领域对起爆终端的要求也越来越高。依照国家标准,在爆破作业流程中,需要在官方授权网站下载起爆文件。起爆终端与远程主机通信过程中,通信安全对爆破作业非常重要,但目前已有的起爆终端没有对无线通信的安全性深入研究,这可能会给整个起爆系统带来安全隐患。此外在起爆终端上一体化完成起爆操作,简化爆破作业流程,也是行业领域一直以来的目标。针对通信安全问
学位
深度学习在现阶段的发展已经渗透到了各个不同的领域,在生物医学图像分割领域中也得到了长足应用与发展。而本文主要针对细胞图像,在该领域中,对细胞图像的分割也依旧是一个热点问题。深度神经网络的多层次非线性表示架构所带来的高鉴别力特征自学习以及整合能力,也给我们利用深度学习去分割密集细胞带来了信心。3D U-Net由于其简洁高效的网络结构被奉为端到端分割中的经典,本文采用的基础网络也是3D U-Net。在
学位
报纸
近年来,随着生活水平的提高,人民对冷链食品的需求逐渐增大,并且当下正值新冠疫情肆虐时期,疫苗的冷链运输需求也不断增长,所以为了改善运输过程中的安全和效率问题,冷链车厂商和相关技术人员越来越重视对冷链车的实时监测。但是当前国内市场上的冷链车载监测系统主要存在监测参数较少、系统功能较为单一、数据传输不稳定等问题,会导致运输途中货物的安全得不到保障,运输效率也会相应降低,对厂商和人民群众的利益造成损害。
学位