注意力引导卷积神经网络的高分辨率遥感影像分类方法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:Mr_Law
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感作为大范围地表监测手段,对地理国情监测、环境变化研究、军事目标识别和可持续发展规划具有重要意义。与中低分辨率遥感影像相比,高分辨率遥感影像包含了更多地物细节信息,具有更丰富的纹理、形状和拓扑结构以及邻接关系等几何信息,能够为遥感影像智能解译提供客观可靠的信息来源。尽管近年来基于卷积神经网络的高分辨率遥感影像分类与典型地物分割得到了长足发展,但是目前仍面临着一些亟待解决的问题,一是大幅宽遥感影像中普遍存在的样本严重不均衡、“类内差异大,类间差异小”以及多尺度密集信息获取困难等问题导致整体分类精度偏低,尤其在小尺寸及占比较少的样本中表现得更加明显;二是地物边界复杂以及地物空间结构信息、全局上下文信息和边界信息获取不足造成分割边界不连贯,锯齿化现象严重。因此,本文旨在围绕以上基于卷积神经网络进行高分辨率遥感影像分类中存在的问题开展相关方法研究。本文的主要研究内容和成果如下:(1)针对高分辨率遥感影像样本不均衡、“类内差异大,类间差异小,”及其密集多尺度特征获取困难等问题,本文提出了注意力引导多尺度空间-通道信息联合的高分辨率遥感影像分类方法(Multi-Scale Dense Feature Extraction Network Module Composed of Position Attention,Channel Attention and Atrous Spatial Pyramid Pooling,PCASPPNet),该方法设计了一个由通道注意力模块、空间注意力模块以及空洞空间卷积池化金字塔(Atrous Spatial Pyramid Pooling,ASPP)组成的并联结构,在缓解了 ASPP结构对输入特征的利用率较低,部分有用信息被忽略等问题的同时辅助引导多尺度空间-通道信息聚合,获取密集多尺度特征。对于Vaiheigen和GID数据集,实验结果表明,与多个经典方法相比,该方法的分类精度明显提升,尤其在小尺寸目标和样本占比较少的地物分类中更具优势。(2)验证不同注意力模块在遥感影像中的响应机制,同时设计消融实验探究不同注意力模块的信息聚合能力。结果表明纵横交叉注意力模块(Criss-Cross Attention Module,CCAM)只响应被标记点“十字路径”上的语义信息,递归纵横交叉注意力模块(Recurrent Criss-Cross Attention Module,RCCAM)通过递归两次CCAM可以获取整幅影像上该类别的相关信息,位置注意力模块(Position Attention Module,PAM)则是在遥感图像上直接建立某一像素与其他所有像素之间的联系来捕捉到同种类别间的相似性语义信息及其远距离依赖关系,故全局上下文信息聚合能力PAM>RCCAM>CCAM。此外,通道注意力模块(Channel Attention Module,CAM)通过模拟不同通道间的依赖关系,明确响应了不同的类别。(3)针对地物空间结构信息、全局上下文信息及边界信息挖掘不足造成的边缘像素易于错分等问题,本文设计了一种基于门控卷积和注意力模块的典型地物精细化语义分割网络(Fine Segmentation Network Based on Gated Convolution and Attention Module,GAFSNet),该网络通过语义分割支路获取具有辨别力的地物特征,明确地物是什么,利用边缘检测支路获取地物准确的位置和边界特征,明确地物在哪里,采用这种“what-where”联合学习方式提高网络的细粒度表征,从而克服分割边界不连贯,锯齿化现象严重等问题。同时,采用PointRend模块改进基线方法DeeplabV3+和FPN,以迭代细分策略提高其在边界处的分类精度。对于WHU数据集,改进后的基线方法能够自适应地渲染出抗锯齿的高质量分割结果。此外,分别与改进前后的基线方法相比,GAFSNet被证明在建筑物精细化分割中取得较好的成果。
其他文献
在矿山企业的大型机电设备中,矿用减速器在生产过程中承担着传递动力的关键作用,减速器的正常运行对矿山企业的安全生产具有重要意义。滚动轴承作为矿用减速器的关键部件,常在大负荷、连续长时间运转或维护保养不及时等工况下运行,因此容易受到损害。滚动轴承故障不仅影响减速器的正常工作,造成企业计划外的停机停产,还可能会因为机电设备故障导致井下通风、供排水、运煤运矸等环节宕机带来安全生产事故,严重情况时更会对井下
煤炭是我国的主要能源,随着工业互联网、人工智能、物联网、智能机器人等技术的发展,建设智能矿山符合国家发展战略,是煤炭行业的必然选择。因此,通过研究煤矿井下空间的实时三维建图、定位和导航技术,可以解决井下机器人和人员的定位及导航问题,有利于保障人员安全和提高智能化开采效率,对建设智能矿山具有重要意义。同步定位与地图构建(Simultaneous Localization and Mapping,SL
城市化进程的加快,使得垃圾数量飞速上涨。正确分类垃圾并提高垃圾的回收循环利用率不仅能够保护环境还可以节约资源,我国从2019年开始,许多城市逐步出台了强制垃圾分类的准则。然而,目前智能垃圾分类的应用不是很多,国内的智能垃圾分类研究更是起步较晚。当前的垃圾分类算法存在网络参数量过大、不便于移植到移动设备中、实际场景下适应性较差等缺点。本文研究了六种不同的网络模型,并在公共数据集Trashnet上实验
近年来,随着煤矿信息化程度的提高,采、掘、提、运、通等系统设备在生产过程中产生了海量的安全生产管控数据与经营管理数据,在智慧矿山的时代背景下,构建合适的煤矿大数据流式计算平台,挖掘数据内部价值,实现安全生产设备各个绩效指标的流式计算与分析,为煤矿精益化管理提供决策支持,以此探寻有效的降本增效运营模式,对煤矿企业发展具有重要的意义。论文以陕西黄陵双龙矿皮带系统为研究对象,提出了主煤流运输设备指标的流
随着互联网的迅猛发展,安全和隐私问题备受关注。图像作为信息载体,在各个领域应用广泛,如何确保其在网络上进行安全存储与传输,是目前的研究热点之―。图像秘密共享是图像的一种保护机制。目前,图像秘密共享主要分为基于多项式的图像秘密共享和视觉秘密共享两大类。根据图像重构方式的不同,前者又分为传统的(k,n)门限图像秘密共享和渐进式图像秘密共享。传统的(k,n)门限方案提供了一种“全有或者全无”的恢复模式,
现实世界的网络大部分随着时间不断变化,因此也被称为动态网络。为了挖掘这些动态网络数据中隐藏着的巨量价值,动态网络演化分析成为了目前的一个研究热点。其中,动态网络中的社区演化过程分析是最有意义的研究方向之一,其在影响力分析、信息传播、网络营销等应用中都具有重要价值。论文在总结动态网络社区演化过程分析现有研究的基础上,对社区演化过程分析基本框架中的重要环节进行了重点研究,主要工作包括:第一,在动态网络
通过计算机视觉技术实现煤矿钻杆的自动计数既能保护矿工的生命安全,又能创造巨大的经济价值,具有重要的研究意义。目前,现有钻杆计数方法主要包括以RFB算法为代表的目标检测算法和以孪生网络算法为代表的目标跟踪算法。由于煤矿井下监控视频图像噪声干扰严重且有效信息缺失,现有方法在井下目标检测和跟踪时精度差、效率低。为此,本文提出一种结合改进RFB和孪生网络的钻杆计数方法。主要工作如下:针对噪声干扰、图像模糊
传统隐语义模型推荐算法仅仅使用用户历史评分和部分偏置项,没有充分挖掘到用户更深层次的潜在信息,从而导致推荐效率和用户满意度不高等问题。为了解决传统隐语义模型推荐算法存在的问题,首先对基于项目的协同过滤推荐算法进行研究,通过引入用户浏览信息的先后关系提升推荐精度;其次通过补充时间因素和用户浏览信息的先后关系等方式优化传统隐语义模型,进一步提升该模型的推荐性能;最后将改进后的算法进行融合,并将融合后的
渝西涪陵页岩气田以及川南威荣页岩气田的发现,标志着四川盆地下古生界暗色页岩勘探取得突破。对盆地周缘包括北大巴山地区在内的下古生界页岩气地质调查和评价也受到重视。北大巴山南缘钻探结果发现下寒武统鲁家坪组页岩现场解析气质量体积为0.045mVt-24 m3/t,同时地质调查也在该地区发现有油苗和沥青点,预示北大巴山下古生界具有油气潜力。因此,亟需对北大巴山地区下古生界鲁家坪组和斑鸠关组富有机质页岩的生
建筑物作为城市重要人工地物之一,基于高空间分辨率遥感影像进行建筑物信息提取在城市建筑智能普查、不动产登记、城市建设等领域中发挥着重要作用。由于建筑物自身的复杂性,传统提取方法无法高效准确地完成建筑物自动化提取,因此,如何精确、快速地实现高分辨率影像中建筑物自动化提取成为当前亟待解决的问题。传统提取方法中,目视解译法虽有较高的提取精度,但提取过程耗时耗力,不适合大范围推广。传统机器学习和卷积神经网络