面向无人机伤员搜救的视觉图像增强方法研究

来源 :军事科学院 | 被引量 : 0次 | 上传用户:FreeDom_BBQ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“白金十分钟,黄金一小时”是伤员搜救的重要准则,但复杂多变的灾后或战场环境制约伤员搜救任务的快速展开,影响伤员后续的救治和康复。搜救无人机可以从空中快速抵近现场,通过视觉传感器获取现场图像,并结合目标检测算法实现快速的伤员目标搜索,提高伤员搜救任务的效率。然而无人机视觉传感器易受外界环境干扰,其图像会出现不同类型缺陷,伤员目标检测算法运行性能急剧下降。因此,本文开展基于深度学习的图像增强研究,提出三种图像增强模型,并将之应用于无人机视角的伤员搜救任务。通过增强缺陷图像中的伤员信息表达,提高伤员目标检测算法在缺陷图像上的性能表现,实现基于鲁棒视觉的伤员搜救。本文取得如下创新性成果:1.针对搜救现场的伤员缺损图像,设计了一种通用渐进式图像修复框架,该框架可以将复杂图像修复任务拆解成若干易于实现的子任务单元。首先设计具有基本图像修复功能的单元网络,随后通过渐进式结构串联各单元网络构建完整图像修复网络。该框架采用三项模型构建策略以保证深层网络、维持模型稳定并提高修复质量:待修复图像的多级输入以降低梯度弥散风险,各单元网络的参数共享以降低模型权重,以及不同损失函数组合以从多维度约束修复后图像的质量。在该框架内构建了一个轻量化渐进式图像修复网络模型(Lightweight Progressive Inpainting Network,LPIN),它能够保持简洁架构的同时实现先进的图像修复功能。在公开无人机遥感图像上的验证结果表明,与LPIN结合的场景分类算法在不同类型缺损图像上的总精度最高可达无缺损图像上的99%;在自建伤员目标检测验证图像(Casualty Object Detection Validation Image,CODVI)上的结果表明,与LPIN结合的目标检测算法在不同类型缺损图像上的平均精度最高可达到无缺损图像的97%。2.针对LPIN对不规则孔洞缺损图像的语义修复能力不足的问题,设计了基于注意力的语义修复单元网络(Attention-based Semantic Inpainting Unit,ASIU),并在本文的图像修复框架内以ASIU为基础构建了渐进式图像修复生成对抗网络模型(Progressive Inpainting Generative Adversarial Network,PIGAN)。在ASIU中,设计了通道注意力上采样层(Channel Attention Upsample,CAU)使模型加强对合理特征的关注,同时使用部分卷积结构抑制缺损区域特征的表达。此外,生成对抗结构可以保证PIGAN输出更真实的图像修复结果。相比于LPIN和其他几种主流图像修复模型,PIGAN具有更好的图像修复能力。在自建CODVI图像数据集上的结果表明,与PIGAN结合的目标检测算法在不规则孔洞缺损图像上的平均精度最高可达到无缺损图像上的94.5%,高于LPIN的89.1%。3.针对搜救现场的暗光伤员图像,设计了一种不依赖匹配暗光/亮光图像的无监督亮度转换生成对抗网络模型(Lightness Transfer Generative Adversarial Network,LTGAN),能够有效提升暗光图像亮度。在LTGAN中,使用了额外的HSL格式图像作为输入以降低模型对RGB格式图像的依赖,防止增强后的图像出现色彩失真;同时基于Retinex理论和HLS格式图像设计了光照感知模块(Light Perceptive Module,LPM),使模型能够更专注于处理图像的亮度信息。LTGAN在公开暗光图像上实现了良好的亮度提升效果,在真实暗光伤员图像上提升了15.9%的伤员目标检测算法平均精度。4.针对真实环境下的无人机视角伤员搜救实用化需求,构建了伤员搜救数据集(Casualty Search and Rescue Dataset,CSARD),并在此数据集上进行了结合本文图像增强模型的三种通用目标检测算法Faster R-CNN、YOLO v3和YOLO v4(简称“结合算法”)性能测试实验。结果表明,结合算法在缺陷图像上最高提升了50%的检测平均精度。在缺陷视频上的实验结果表明,结合算法最高降低了31%的伤员漏检率。在不同飞行高度和速度视频上的鲁棒性实验结果表明,本文图像增强模型同样有效。综上,无人机搜救现场的图像缺陷会导致伤员目标检测性能急剧下降,本文围绕这一问题提出三种图像增强模型。首先,针对伤员缺损图像提出了一种通用图像修复框架,并在此框架下构建了两种图像修复模型LPIN和PIGAN;其次,针对暗光伤员图像提出一种暗光图像亮度提升模型LTGAN;最后,构建了无人机视角的伤员搜救数据集CSARD,并基于此对各图像增强模型进行了评估实验。实验结果表明本文的三种图像增强模型能够显著提高不同目标检测算法在缺陷图像和视频上的目标检测性能,降低伤员漏检率,从而提高了基于视觉的伤员搜救任务鲁棒性。
其他文献
<正>安徽黄山哼哼达猪场引种莱芜黑猪300头,自繁自养,全场采用青岛得八兄弟机械有限公司(以下简称“得八兄弟公司”)提供的液态饲喂系统,整个项目2022年7月底安装完成,但是在调试和刚刚进猪的阶段,陆续出现了一些问题,本文全程记录了出现问题的原因、表现形式和解决方案,以及最终的处理结果。液态饲喂属于新兴事物,
期刊
<正>之前读李希贵校长的《学校制度改进》,就深切体会到他的管理思想中所体现出来的精湛的领导力。读了《当校长遇见德鲁克:冰山下的领导力》以后,便觉李希贵校长深得德鲁克管理思想的精髓:“管理的本质是要激发和释放每个人的善意和潜能,管理的终极目标就是改善他人的生活。”[1]这同时在强调,作为校长,要修炼的是领导力,而非管理力;作为校长,
期刊
旨在制备非洲猪瘟病毒(ASFV)p54蛋白的特异性单克隆抗体。本研究利用大肠杆菌表达系统表达p54蛋白,免疫BALB/c小鼠,取其脾细胞与SP2/0细胞进行细胞融合。利用纯化的p54蛋白作为包被抗原,采用间接ELISA方法筛选获得阳性杂交瘤细胞。经4次亚克隆后,取杂交瘤细胞上清进行单克隆抗体亚型鉴定,利用体内诱生法制备单克隆抗体并进行纯化。间接ELISA方法检测单克隆抗体的效价,利用交叉反应性试验
目的 探讨中老年糖尿病足患者发生压力性损伤的影响因素及预防对策。方法 以2016年12月至2021年1月山东大学齐鲁医院收治的366例中老年糖尿病足患者为研究对象。采用问卷形式收集患者的一般资料,并通过电子病历库收集其临床资料,分析压力性损伤的发生情况。将366例患者根据在住院期间是否发生压力性损伤分为发生组(102例)和未发生组(264例),并对发生压力性损伤的影响因素进行分析,提出针对性的预防
在公司业务经营过程中国家要求公司必须向政府税务部门上缴一定的税收,这也是当前税法的规定。部分公司为了提高经营效益,进而通过一系列的避税方法降低公司的纳税额。在当前的公司经营过程中合理避税已经成为公司内部财务管控的一个重要部分。通过使用合法合规的避税手段为公司减轻赋税,降低经营成本,提高公司经营效益。文章重点对公司重组工作中如何科学合理的避税进行重点的分析和研究。
近年来,无人机技术与应用的迅猛发展,丰富了海上救助的技术和手段。本文通过分析当前海上救助风险及当前救助手段的局限性,探讨无人机在海上救助中应用的可行性,并提出海上救助对无人机发展的特殊需求,促进救援手段的多样性、全面性发展,提高救助效率。
高三英语大单元整体复习立足于对英语学科核心素养的培养,围绕主题意义探究和生成的主线,打破教材原有的结构和体例,以主题为纲对教材内容整合和重构,形成更大的主题单位,引导学生对形成的主题单位进行意义上的整体认知和建构,并实现在主题意义探究过程中语言能力的提升。提出大单元视角下高三英语整体复习实施策略,即确定主题,重构单元;围绕主题探究,制订单元目标;对照单元目标,设计评价量规;立足单元目标,设计单元复
<正>据《沧县志》记载:"吴钟北方八极拳初祖……吴钟生于康熙五十一年,卒于嘉庆七年,享年90岁。吴钟八岁就传,聪慧过人,年甫弱冠,勇力过众,遂弃书学技击……一夜方舞剑庭中,有然自屋而下者,黄冠羽士也……后传八极之术,道士留十年。临别钟泣而拜曰:’十年座下,贶我良多,惟以不知师之姓名为憾。’道士慨然曰:’凡知癞字者,皆我徒我。’言罢辞去……逾二年又一人来谈:’吾癖字也。’,赠八极秘诀一卷,并传授大枪
期刊
<正>无人驾驶飞行器(简称“无人机”或“UAV”)是一种不需要驾驶员的飞行器,可以根据预编程的飞行路径自主飞行,也可以由地面操作人员通过遥控器操控来完成指定的任务。[1]无人机可以代替人完成肮脏、枯燥或危险的任务,比如自然灾害后的搜救任务等。搜救行动的主要目的是在最短的时间内识别和营救目标[2],任何延误都可能降低受害者的生存机会。由于无人机具有灵活、便携等特点,已经在搜救行动中被广泛应用。无人机
期刊
伴随潮流文化的兴起,潮玩以盲盒作为销售载体,逐渐受到人们的关注。P公司作为中国“潮玩第一股”,赴港上市首日总市值便超过1000亿港元,每股股价达到107.6港元的峰值。作为成年人的玩具——潮玩,开始受到资本的青睐。基于哈佛分析框架选取P公司2018—2021年的财务数据对P公司进行战略、会计、财务、前景四个方面的分析,引入波特五力模型和相关财务数据等辅助分析,旨在了解P公司财务现状,发掘存在的问题