面向空基平台的图像智能检测研究与实现

来源 :四川大学 | 被引量 : 0次 | 上传用户:flymummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于空基平台航拍图像的目标探测识别在军事、民用等领域有着广泛应用,相比于传统目标检测任务,航拍图像具有视场大、目标小、目标分布差异大、背景纹理复杂等特点,极大增加了深度学习模型的训练难度,影响目标检测性能。本文结合高空航拍图像特性,依托于某航空工业公司对地探测识别科研项目,开展了面向空基平台的无人机航拍图像地物检测系统的研发,实现航拍图像中目标检测的高精度定位识别,论文研究成果已在相关单位进行部署和应用,具有较强的实用价值。本文主要研究内容和创新点如下:(1)在模型预测过程中,高空航拍图像中小尺度离散目标特征容易被忽略,而目标密集区域由于降采样特征提取容易造成大量漏检,针对这种目标差异性分布与多尺度检测问题,本文设计了双向特征融合金字塔模型BDFPN,保证了高维特征和低维特征的有效跨层特征融合,提高了模型不同感受野条件下多尺度目标的定位识别能力,同时采用了旋转框定位回归方法,设计回归平衡损失Balance Loss和分类回归关联损失函数Relation Loss,构建了面向航拍图像的目标旋转框定位检测模型,有效提升了目标框分类回归的精度。在旋转目标数据集HRSC2016和UCAS-AOD中分别达到了94.28%和96.20%的精度,同时在水平目标检测任务中,VOC2007数据集测试精度达到了85.4%,相比于Retina Net提升了4.2%。(2)针对高空航拍目标占比小、背景纹理复杂等问题,本文设计实现了基于注意力机制的精细目标特征优化器FAM和IAM,构建特征优化网络模型,结合旋转目标定位框掩膜保留特征图中小目标的重要特征,减少了航拍图像小目标丢失漏检的情况,针对单步检测器和两步检测器分别设计了对应的注意力机制优化模型,有效解决了随网络深度增加导致的低维特征损失的问题。在HRSC2016数据集中,基于Retina Net的单步检测模型中,m AP提升了4.75%,在基于FPN的两步检测模型DOTA数据集测试中,m AP提升了2.76%。(3)针对航拍图像目标检测的实际应用需求,本文设计开发了基于航拍图像的地物检测系统,该系统适用于军事侦察、工程模拟等复杂场景,设计开发了面向大尺度图像的训练检测方法,对检测模型提出了多种优化策略,以提高检测精度;集成了数据处理、模型训练、模型切换以及检测识别等多种功能;支持地面站部署,同时对无人机机载进行探索;能够对特定目标进行自动识别与定位,达到高度的稳定性和实时性,通过实验测试和实际应用,该系统能够有效检测出无人机航拍图像中的车辆、舰船等目标,验证了系统的整体性能和实用性。本文开发的航拍图像地物检测系统已在某航空工业公司进行部署应用,针对其无人机真实航拍图像进行分析测试,具有较好的实用性和经济价值,有效提升了航拍图像对地目标的检测精度。
其他文献
经济与资源全球化现象以及以3D打印为代表的智能制造技术发展使得客户对于零件的个性化定制提出了更高的要求,结合互联制造的时代背景,以网络为基础的协同工作环境也为零件远程定制提供了更多的可能性。基于远程协同的零件定制系统平台应运而生,为客户和企业服务商之间搭建了信息互通的桥梁。目前现有的3D打印零件定制系统平台多数对于普通用户的友好度不够,并且以线性的单向需求传递为基础来进行反馈,缺乏高效率的协同设计
地质灾害监测关键设备及采集数据处理是整个地质灾害监测过程中的关键步骤,其核心是解决地质灾害防控过程中的数据采集、数据传输、数据处理和预警模型的研发。由于地质灾害的监测是一个影响因素众多、监测环境复杂、并且需要进行长期监测过程,所以建立一套高可靠的地质灾害信息化管控系统十分必要。本文主要实现基于GIS的地质灾害监测设备及系统研发。在传感器将数据采集完成后,将数据通过无线传输到四川省地质灾害数据中心。
抑郁症是一种的常见精神疾病,重度抑郁症甚至导致患者自残或自杀,并且自杀事件的发生已开始呈现出低龄化趋势,严重影响个人、家庭和社会。临床证明,提早发现抑郁症并进行有效的心理干预和药物治疗,能够缓解甚至治愈抑郁症患者。然而,抑郁症的病因繁复多样,导致临床诊断困难,误诊、漏诊率较高。临床发现,抑郁症患者在语音、文本、表情、生理等模态的数据上都表现出一定的特异性。针对抑郁症多模态数据,建立计算机辅助诊断模
每年由于人口老龄化、车祸以及肿瘤等引起的严重骨组织病损有上千万例,骨科临床亟需研发具有个性化尺寸特征以及优良骨整合效果的骨组织工程支架。骨组织工程支架的表面是宿主骨组织与植入材料相互作用的重要界面,是成骨细胞黏附、增殖、分化的主要场所,其对骨整合性和骨组织修复重建具有决定性的作用。本文利用选区激光熔化3D打印技术制备具有个性化宏观尺寸特征的骨科植入体,通过调控3D打印中的关键工艺参数,提出一种基于
近几年,人脸图像在视频监控和识别领域的应用越来越广泛,人脸图像数据显得更加重要。在获取人脸图像的过程中往往会产生模糊,其中最常见的是相机与人物之间相对运动造成的模糊,称为运动模糊。产生运动模糊的人脸图像会大幅影响监控与识别的效果。因此,去除人脸图像的运动模糊在计算机视觉任务中有着重要意义。在计算机视觉领域中,现有的人脸图像去模糊算法并没有针对运动模糊问题;而已有的去除运动模糊算法并没有针对人脸图像
关系抽取旨在识别文本中的成对实体的关系事实,被广泛应用于知识图谱构建和自然语言处理领域。与专注人工设计特征的传统方法相比,基于深度学习的关系抽取方法已取得了显著成果。但是,现有的这些关系抽取方法通常假定待预测的关系类别是一个封闭的关系集合,没有考虑需求的动态变化,不适用于实际的应用场景中。由此引出了对终身关系抽取的研究,也就是说,需要预测的一组关系可能会随着时间的推移而改变或扩大,同时我们无法在每
随着高通量测序技术的发展,生物信息数据已进入到EB量级的多元组学大数据时代。如何将生物信息大数据迅速转化为新知识,并能应用于进一步的研究中,则需要依赖于数据挖掘技术的运用。对于人类基因组的研究,有研究表明,在人类基因组中存在CpG岛这么一种特殊的DNA序列,它与人类基因表达调控密切相关,对于研究CpG岛序列在基因座上的分布、CpG岛序列的特异性、CpG甲基化编码与基因的关系及其功能相关性等是非常重
命名实体识别任务的目标是定位自然文本中的实体并将其分类至预定义的类别中。命名实体识别任务一方面可以帮助阅读人员快速定位到冗长文本中的关键信息,另一方面它是其他下游自然语言处理任务的基础,高效的命名实体识别工具可以辅助其他的任务达到更好的效果。早期,解决命名实体识别问题采用的是传统的特征工程方法,这些方法都需要凭借经验定义大量的人工特征,不仅耗费大量的人工成本,还缺乏迁移性。随着算力的提升和深度学习
空间感知能力是动物与生俱来的一种天赋,动物通过这种能力可以完成位置估计、导航之类的工作。研究表明,网格细胞是与动物的空间感知能力密切相关的一种细胞。这种细胞位于动物脑内的内侧内嗅皮层(Medial Entorhinal Cortex,MEC),且它与海马体(Hippocampus)的位置细胞(Place Cell,PC)有着密切的联系。每个网格细胞的各个放电野组合呈现出一种六边形的排布,且越靠近每
随着全球第四次工业革命的爆发,工业物联网技术在工业制造领域得到了广泛应用,推动着传统制造业逐步实现智能化改造和发展。与此同时,工业物联网系统在信息安全领域所面临的安全威胁也日益严重,如何确保工业物联网系统的通信安全已经成为工业物联网安全的一个研究热点。认证密钥协商协议是保障公共信道中通信安全的重要手段,能实现通信双方的身份认证和密钥协商,满足“一次一密”的数据加密要求。由于工业自动化生产的需要和工