基于改进深度学习的无人艇检测算法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:jaeiris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人艇(Unmaned Surface Vessel,USV)近年来逐渐进入人们的视线,不论是从军事角度还是民用角度都得到了足够的重视。无人艇的可重构性使得它在军事活动中独立执行任务,这极大保障了人员的安全。在民用行业,无人艇可以轻松的完成高强度的作业任务。虽然无人艇给人们的生产生活带来了便利,但是也给国家的海岸线安全与航行规范造成了巨大的威胁与困扰。传统的无人艇检测技术精确度低、自主化不高、监控范围等方面有明显的不足。而基于深度学习的目标检测技术能够克服这些困难从而对无人艇进行有效的检测。目前,国内外基于深度学习的无人艇检测技术尚不成熟,因此本文在深入分析基于深度学习的目标检测技术的基础上,针对无人艇这类速度快、体积小的目标,从事了以下几项研究工作:(1)无人艇是新兴领域中一类结合有前沿技术的无人化智能设备,在采用深度学习检测这类目标时,需要网络模型针对数据训练从而拥有针对这类特征的检测能力。但是目前常用的数据集中并没有对这一类特征的标注。所以,本文中从军用无人艇以及民用无人艇两方面对无人艇图片制作数据集。为了完成目标检测的任务,使用Label Img标注软件将数据图片转化为VOC数据集形式。在实例分割任务中,采用Labelme标注工具对无人艇额外增加一个掩膜用以在检测时区分不同的目标。(2)在目标检测的任务中,为了能够实时的对无人艇这类航行速度快、体积小的目标进行检测。本文提出了一种基于ECIo U(Enclosing Center distance Intersection over Union)损失函数的YOLOv3(You Only Look Once version 3)算法,在MATLAB的仿真实证明,所提出的损失函数在模型收敛速度上具有先进的优势。在提出的算法基础上进行数据集的训练以获得对无人艇这类特征的检测能力。同时,由于在远距离情况下,无人艇的成像效果小,需要引入多尺度预测网络,YOLOv3的多级残差网络结构刚好满足对小目标的检测要求。E-CIo U损失函数的提出,使得目标框的定位更加准确,对于提升算法的精度具有重要的作用。(3)在候选框选择方面,提出了改进的Cluster NMS算法,在无人艇含有遮挡情况时,结合E-CIo U距离损失,在确保临近目标框为同一类的两个预测框的同时依据高斯平滑函数对目标框的置信得分进行一定程度的衰减,进而增加了对含有遮挡目标框的输出概率,提高了模型的检测精度。在实例分割方面,采用YOLACT分割算法中的掩膜预测框架,其一阶段的多级预测结构在保证实时性的同时增加了模型对小目标的分割精度。无人艇检测与分割的同时运用,使得检测具有了更丰富的图像信息。
其他文献
21世纪以来,服装行业的竞争日趋激烈,以计划驱动的标准化、规模化的生产模式已不能满足消费者多样化需求,服装企业正不断向小批量订单式生产转型以适应需求变化、缩短产品生命周期、提升库存周转率,这对服装制造业生产管理水平提出更高要求。目前企业在进行服装大规模个性化定制时,面临交期不确定、订单响应速度不及时、车间柔性化程度不高等问题,在生产过程中瓶颈排除不及时,生产进度难以控制导致无法准时完成订单任务,亟
乙酰乙酸基团是一种有机合成中常用的高反应活性基团。它可以和多种常见的官能团进行反应,比如烯胺化反应、迈克尔加成、多组分反应、酶促聚合、金属络合等,从而得到不同的功能性产物。纤维素作为分布最广泛、应用最悠久的可再生天然高分子,具有极高的利用价值和发展前景。通过酯化反应将乙酰乙酸基团接枝到纤维素骨架上,再进行二次衍生,可以轻易地实现对纤维素的各种改性,进一步拓展纤维素的应用领域。本论文分别使用生物酶催
在当今信息化时代,如何快速并且准确地从互联网海量的信息资源中获取自己所需要的信息显得十分重要,于是个性化推荐系统应运而生。电子商务是近年来比较火热的一个行业,个性化推荐系统在电商平台上的应用被广泛关注。大多数推荐算法的研究都依赖于显式评分数据,然而电商平台中丰富的隐式反馈数据信息蕴藏着巨大的推荐价值,近年来,面向隐式反馈的推荐算法研究也越来越热门,其中有学者提出了一种个性化推荐模型:贝叶斯个性化排
随着网络时代的快速发展,网民们可以在不同的生活网站上针对各种各样的商品发表自己独特的评论,也可以在社交网络中针对某一社会现象提出自己的见解。用户发表的文本评论信息中包含着很多带有情感倾向的语句,这些语句经过整理与研究分析后,对商品和社会等相关领域具有很高的研究价值。因此文本情感分析作为自然语言处理研究的子领域,在过去几年中受到了广泛的关注。方面级别的情感分类是情感分析中的一项细粒度的工作,与传统情
深度学习作为人工智能中的关键技术,已成功用于解决各种2D视觉问题,基于深度学习的三维物体识别技术在自动驾驶和机器人等许多3D视觉领域的广泛应用,也逐渐引起了越来越多的关注。通过各种先进的3D扫描仪可以直接获取到日常生活场景中三维物体的表面点云,但由于点云的无序结构,使得神经网络处理点云时面临着独特的挑战。近年来,研究者们提出将点云转化成其他表示形式来解决该领域的不同问题,如渲染成多视角二维图像或者
图像修复是指利用待修复图像已知部位的信息按照某种规则来填充修补未知部位,达到人眼无法分辨图像是否被修复过的效果。传统的图像修复方法,例如基于纹理或结构的方法,在修复大面积区域破损的图像时效果不佳。如何保证修复后的图像不仅在语义和结构上连贯,同时还原缺失区域的细节和纹理成了图像修复领域的主要研究热点。自从生成对抗网络出现以后,由于其强大的生成和特征学习能力被广泛应用于图像修复任务。传统的生成对抗网络
由于单一的成像方式存在固有的缺陷和局限性,临床上常把多种成像技术相结合用于肿瘤的精准诊断。作为应用最广泛的成像技术之一,计算机断层扫描(CT)能够以高空间分辨率和高密度分辨率呈现有价值的解剖结构和功能信息,磁共振(MR)成像对软组织具有高灵敏度和高分辨率。因此,开发肿瘤靶向的CT/MR双模态纳米造影剂可以结合两者的优势,显著提高肿瘤诊断的敏感度和准确性。核-壳结构树状大分子(CSTDs)是一种以聚
羊毛角蛋白是典型的可再生生物质资源,废弃羊毛中角蛋白资源的开发是值得研究者关注的话题。低共熔溶剂(DES)作为一种新型溶剂,在蛋白质纤维的溶解领域展现出较好的潜能,并且符合绿色化学的要求。再生角蛋白可作为碳和氮的提供源,通过与聚合物的复合、碳化等方式制成超级电容器的碳电极材料。角蛋白的再生及电化学应用对废弃生物资源的利用、生态环境的保护以及新型储能器件的开发都具有重要意义。因此,本文合成了适用于羊
在消防员执行火场救援任务或日常训练中,需穿着消防服抵御外界环境危害,主要包括火焰、热辐射、磨损等。消防服通常由外层、防水透汽层、隔热层三层阻燃织物构成,其性能好坏直接关系到消防员的生命安全。然而,在消防服使用的过程中,会遭遇来自作业环境和产品维护条件等多种因素的作用,这些外界因素的作用均会导致消防服材料出现不同程度的老化,从而影响织物的性能。各种标准已明确规定了消防服性能的最低要求,但对于消防服能
信息抽取旨在从文本中提取出特定的事实信息,用于构造结构化数据,作为自然语言处理主要的研究方向之一,包括命名实体识别、关系抽取和事件抽取三个子任务。目前,基于深度学习的信息抽取已经取得了一些研究成果。但是,现有的中文信息抽取方法大都基于词向量表示进行模型的改进,而忽略了文本表示的重要性。同时,以词向量作输入的模型高度依赖于分词工具的质量且中文还存在多义性的问题。为此,本文从语言学角度分析了中文文本的