基于深海大型底栖生物图片的智能标注算法研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:yczhudong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海洋面积占地球总面积的绝大多数,其中蕴藏着丰富的石油、天然气、矿物、化学和水生资源。由于人类生存空间的不断扩大,土地资源被过度开发,世界上大多数国家都将注意力集中在开发海洋资源上。因此,近年来相关的水下机器人和探测技术得到了迅速发展。水下目标检测技术依赖于大规模的标记数据,但是目前深海底栖生物图片标注工作所需的人力成本较为高昂,该类图片标注工作量大、重复性高,而且要求标注人员拥有相关专业技能。因此,对深海大型底栖生物数据智能标注的研究是十分必要的。本文深入研究基于深度学习的目标检测模型和主动学习框架,针对深海底栖生物数据集的标注问题,分别从图片增强和主动学习框架改进两方面入手,提出了基于定位稳定性选择和伪标签的主动学习算法(Localization-Aware-Choice and Pseudo Label Active Learning)。该算法的核心内容包含基于特征提取与聚类的样本简化方法、改进基于LS(Localization Stability)的主动学习样本选择策略和改进基于伪标签的半监督学习方法。本文提出的智能标注方法使用主动学习框架加速模型训练,选取优质样本使模型在相同规模的数据集中取得更高的精度,然后使用训练得到的高精度模型对无标签数据进行预测,生成标签。本文提出的主动学习方法能够极大地提高数据标注的效率,降低人工标注工作强度。本文的主要研究工作如下:(1)针对深海大型底栖生物图片普遍存在的低可见度、模糊、色彩失真等问题,本文主要研究了基于图片修复的预处理方法和基于图片增强的预处理方法,并对比了不同预处理方法的实验效果。在此基础上,本文选择使用基于图片修复的预处理方法ULAP(Underwater Light Attenuation Prior)嵌入主动学习框架中。(2)针对传统主动学习方法的选择策略在进行样本选择时,存在选取相似样本的问题,本文在主动学习框架中引入了特征提取和聚类方法,优化选择策略。首先,使用Faster R-CNN的特征提取网络VGG16,对样本进行表征学习,随后使用K均值方法对模型学习到的特征进行聚类,在聚类结果中选取中心样本进行人工标注。此方法不仅能够有效过滤相似样本,降低人工标注的工作量,而且可以均衡训练样本数量。(3)针对主动学习选择策略Localization Stability在选择样本时,加入噪声过量导致预测框稳定性计算不准确的问题,本文在主动学习框架中引入了噪声样本选择机制,并使用DIOU(Distance-Intersection Over Union)作为锚框距离度量方法,更好地反映预测框的稳定性。(4)针对目标检测模型训练样本不足的问题,本文在主动学习框架中引入伪标签机制,并对其进行了优化。在主动学习框架迭代前期,模型选择置信度与稳定性乘积高于某一固定阈值的样本赋予伪标签,随着训练迭代次数增加,逐渐减小该阈值,为更多的样本赋予伪标签,以优化模型的训练过程。本文在2020年中国水下机器人专业大赛提供的公开数据集上进行了对比实验,在使用相同数量样本进行训练的情况下,本文提出的主动学习框架将模型的准确率提升了1.73%。在模型达到相同精度的情况下,本文提出的主动学习框架可有效节省13%的数据。实验结果表明,本文提出的主动学习框架能够有效降低人工标注工作量,提升模型的训练速度,对深海底栖生物图片标注工作具有重要的作用和意义。
其他文献
在图像处理领域,高光谱遥感成像技术有着极强的地物探测识别能力,可以实现对由地物本征成分决定的光谱信息和表明地物形状纹理的空间图像进行同步采集,进而对目标对象进行精准检测和分析,所获取的高光谱图像也是一种“形态-光谱”一体化的三维立方体数据。自从上世纪末诞生以来,高光谱遥感图像逐渐发展为遥感探测领域中重要的数据来源,而且朝着更广谱段、更精细分辨率方面发展,极大地提高了人们对地物空间的感知能力。然而,
学位
“互联网+”知识经济时代各行业为适应技术飞速的发展面临着巨大的商业变革。在线学习形式因其便利性迅速被市场接受,吸引了众多资本力量围绕创新商业模式布局新产业体系。各类在线学习平台不断探索,尝试从单纯提供教育知识资源向“资源+教育服务+互动社区”的复合商业模式转型升级,通过会员制付费、广告赞助和教学辅导服务的等多种商业模式的有机结合逐步形成了包含多种业态的在线学习社区。尽管在线学习社区具有各种优势,但
学位
社会保险经办机构直接面向大众,是政府为人民提供公共服务的窗口,服务的质量决定了群众对政府的满意程度。面对逐步完善的社会保障体系和日益增长的公共服务需求,社保部门存在的诸多业务流程问题限制了其服务水平的提升。因此必须通过业务流程重组,进一步提升社保部门的服务能力,为群众提供更加高效、便捷的服务。本文首先运用了定性研究的方法,回顾了业务流程重组的理论,介绍了业务流程重组的概念、指导原则与在政府中的应用
学位
海洋信息化在国家信息化中具有重大战略意义,是我国未来海洋事业发展的首要推动力和强大支撑。水声通信技术作为海洋信息获取和传输的核心技术需要进一步研究发展。然而,水声信道复杂多变,单一的调制方式无法适应多变的水声信道。使用自适应编码技术可以根据信道状态选择最优的调制方式,提高数据传输效率,但水下噪声干扰严重,极易导致握手信号出错,因此,在复杂海洋环境下准确识别水声信号调制方式尤为重要。目前水声信号调制
学位
车联网群智感知利用车辆感知环境、采集数据并提供信息服务,在智能交通和智慧城市建设中发挥着重要作用。其中激励机制作为提升感知任务参与度和完成质量的有效手段,已成为车联网群智感知研究中的一个重要方向。现有应用于车联网场景的激励机制大多基于可信第三方,存在单点故障和易引发合谋攻击的缺点。可信方的参与还会造成车辆隐私信息在感知任务的不同阶段遭到泄露,如在身份认证、声誉更新或奖励发放时。已有分布式激励机制虽
学位
在现代航天活动中,光学测量设备承担着轨迹测量和实况图像获取的任务,其拥有高精度数据和可视化图像的优点,以及受天气情况影响较大的缺点。为获取高精度数据,光学测量设备任务前的设备调平工作不可或缺。当前,某型号光电经纬仪的调平方式为手动调平,不仅耗时长,也无法实时获取设备水平度,已经不能适应指挥自动化和远程控制的发展要求。为了提高光学测量设备的调平速度和精度,本论文对经纬仪的自动调平方法进行了研究,并设
学位
环境友好型清洁能源及可再生能源替代传统化石能源备受关注,催化裂解废油脂制备液体生物燃油是生物质能源转化的研究热点。目前用于催化裂解废油脂反应的催化剂存在目标产物轻质油品收率低、过度裂解气相组分产率高、催化剂易结焦失活以及循环使用性能差等缺陷。金属氧化物催化剂易得、活性高,在实现废油脂脱氧和抑制结焦方面表现突出,而具有高比表面积和高稳定性的多功能核壳结构复合分子筛催化剂在提高轻质燃油含量和循环使用性
学位
动态目标准确、可靠跟踪是航天光学测量设备的核心要求。航天目标动态高、受助推器尾焰的影响提取困难,与通常视频监控中的人、车、船的跟踪方法存在明显的区别,常用的跟踪手段无法满足要求。因此,提高动态目标跟踪技术的可靠性、稳定性和自动化程度,对于航天的目标景象观测、特性测量和故障分析具有迫切和重要的研究和工程应用价值。本文首先对复杂飞况下动态目标的跟踪难点进行分析,指出常规跟踪算法存在的问题,提出了一种新
学位
发射塔架电缆摆杆是一个典型的钢结构机械产品,是发射场火箭发射过程中重要的参试地面设备,在临射-1min时打开。为了保证摆杆结构安全,顺利执行每一次发射任务,更准确评估摆杆水平杆疲劳寿命,避免盲目相信摆杆结构安全或频繁更换摆杆造成资源浪费,给其在发射场的使用、维护乃至报废提供理论依据,本文对此课题进行了研究。本文首先对载荷分析和寿命评估相关理论方法进行了研究,其次对摆杆水平杆承受的载荷进行分类分析,
学位
随着微电子应用技术、传感器技术和现代控制技术的不断发展,基于飞行器的产品开发已成为应用行业研究重点,其中以四旋翼飞行器的研究最为广泛。在各领域应用范围中,四旋翼飞行器可根据控制原理灵活的调整姿态和速度信息,适用于庆典航拍、监视侦察、物资运输、信号搜救等应用任务。由于空中气流环境的不确定性,保障四旋翼飞行器稳定运行是目前行业研究热点,本文完整设计了四旋翼飞行器的结构控制系统,并对其姿态控制方法进行了
学位