基于表示学习的目标检测与分割算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户：maoduoli

【摘要】

：

随着人工智能浪潮的到来,深度学习作为表示学习的一个重要分支,其发展大幅提高了视觉识别任务的最终性能。尽管有着大量的理论、学术研究,但在面对复杂应用环境以及计算资源

【作者】

：

马栋梁

【出处】

：

江南大学

【发表日期】

：

2004年期

【关键词】

：

表示学习视觉识别模型性能计算代价推断速度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人工智能浪潮的到来,深度学习作为表示学习的一个重要分支,其发展大幅提高了视觉识别任务的最终性能。尽管有着大量的理论、学术研究,但在面对复杂应用环境以及计算资源相对匮乏的设备平台时,视觉识别模型的表现仍不如人意。作为视觉识别任务的核心问题,目标检测和分割任务的发展始终在模型准确率与计算效率的取舍中艰难前进。本文的核心思想是利用表示学习相关理论,在保证视觉识别任务性能的前提下,能够设计出低延迟、低功耗的视觉识别模型。本文的主要工作如下:对目前表示学习中在视觉识别任务起重要作用的深度卷积神经网络进行梳理,介绍具有代表性的深度卷积神经网络和轻量级卷积神经网络。并对表示学习在视觉识别任务中的相关工作从多尺度特征学习、上下文特征学习以及关系网络三个方面进行概要总结。其中,多尺度特征学习从图像金字塔、预测金字塔、特征融合以及特征金字塔四个角度进行分析;上下文特征学习通过全局上下文特征学习和局部上下文特征学习进行阐述;并对关系网络在视觉识别任务上的应用从图卷积神经网络和自注意力机制两个方面进行整理。针对医院现有医疗设备计算资源相对匮乏的问题,采用上下文特征编码病灶周围区域的信息,再通过自注意力机制选取更具辨别性的特征。将上下文模块与注意力机制联合,构造上下文自注意力卷积模块,以其为基础搭建轻量级卷积神经网络,并将其应用于皮肤病灶分割任务中。本文所提出的上下文自注意力皮肤病分割网络在模型参数仅有0.5 M,计算代价8G FLOPS的前提下,能够在ISBI 2017数据集上能够实现80.9%平均交并比的分割精度。同时,算法在分辨率大小为768×1024图像上能够达到20 FPS的推断速度。实验结果表明,上下文自注意力皮肤病分割网络提高了皮肤病灶检测的研究效率和实用价值。针对人脸识别任务,采用单阶段目标检测框架提取多尺度特征。为解决卷积神经网络浅层特征中语义信息较少的问题,使用空洞卷积和金字塔架构构造轻量级特征提高模块,在尽可能减少计算代价的前提下,提高模型对浅层特征中语义信息的辨别能力。同时,针对模型召回率较低的问题,引入锚点致密策略。算法在PASCAL Face、AFW、FDDB以及WIDER FACE多个数据集上进行测试,在实现高精度的同时,能够在分辨率大小为1024×1024的图像上达到64 FPS的推断速度。并在FDDB人脸检测数据集上取得了超越两阶段检测算法Faster RCNN的检测效果。通过多个实验进行验证,本文所提出的算法能够显著增强人脸检测模型的性能和计算效率。在本文中,我们采用上下文特征学习和多尺度特征学习进行特征提取操作,并结合关系网络中的注意力机制改善卷积算子的弊端,通过设计符合具体任务的卷积神经网络架构,提出用于皮肤病灶检测任务和人脸识别任务的相关算法。我们所提出的算法在具备高精度的同时,能够实现低延迟的识别效果,这对于推动视觉识别模型最终的落地与应用具有一定的研究意义。

其他文献

基于深度学习框架的轻量级人脸识别算法研究

得益于独特的物理属性和非接触、非侵占性,人脸识别技术已经成为了最重要的身份识别技术之一,在众多领域都得到了广泛的应用。在人脸识别算法中,如何提取高质量的人脸特征是

学位

人脸识别深度学习卷积神经网络L1-PCACCIPCA

Al-7.5Zn-2Mg-2Cu-0.2Sc-0.1Er合金低温疲劳变形与断裂行为

铝合金材料的室温疲劳性能的研究已经非常深入和广泛,对于低温环境下铝合金的疲劳变形行为的研究很少,对于低温条件下铝合金疲劳变形过程中合金的微观结构、变形机制等仍不清

学位

Al-Zn-Mg-Cu系铝合金显微组织拉伸性能低温疲劳

基于深度学习模型的软件功能型克隆检测

软件克隆检测致力于找出两段功能相似的代码段,其对软件系统的维护和发展起着非常重要的作用。目前该领域存在很多研究试图有效检测软件克隆,他们多是基于代码段的文本或结构

学位

软件挖掘软件功能型克隆检测深度模型PU学习

我国绿色创新效率评价及影响因素研究

随着我国能源资源的不断消耗和生态环境的日益破坏,以盲目追求经济发展而忽略环境可持续的传统经济发展模式已经无法适应当前的经济“新常态”。“破解当前难题必须坚持创新

学位

绿色创新效率影响因素网络DEATobit模型系统动力学

基于神经网络的金坛区教育系统建设项目施工风险管理研究

近年来,随着经济社会的发展,广大群众对高质量教育资源的需求日益高涨,社会各界对教育事业关注程度不断提高,各级政府不断加大对教育基本建设的投入力度,办学条件得到不断改

学位

教育项目施工风险风险评价人工神经网络

微分人工神经网络的光电研究

在信息量爆炸的时代,处理大量数据的能力变得至关重要。微电子技术的发展与成熟有助于应用新兴的人工智能服务和高性能计算的下一代产业的出现。这些数据密集型企业严重依赖

学位

光学神经网络马赫-曾德尔干涉器微环谐振器常微分方程波导

准分子激光微区剥蚀分析系统控制及数据采集技术研究

激光剥蚀是指将激光束聚焦后照射基板,基板材料吸收激光能量蒸发或转换成等离子体,实现从固体表面去除部分材料的过程。激光剥蚀效果与激光能量密度、波长、光束质量以及材料

学位

激光剥蚀准分子激光LIBSLA-ICP-MSLabVIEW操作者框架

基于同球向双球面支座的简支梁桥减隔震性能研究

近年来,我国高速铁路实现了跨越式大发展,但同时中西部地区地震频发,高速铁路简支梁桥的抗震性能越来越得到重视。但考虑到高速铁路多采用重力式桥墩,及其采用延性抗震设计的

学位

高速铁路简支梁桥同球向双球面减隔震支座地震响应支座耗能减隔震性能

H2S/CO2环境中13Cr和FV520B不锈钢的应力腐蚀行为

13Cr马氏体不锈钢因其较高的性价比和良好的耐蚀性能,广泛应用于石油化工领域。13Cr不锈钢的应力腐蚀行为研究主要集中在常压CO2环境,对高压CO2和常压CO2含低浓度H2S环境研究

学位

应力腐蚀13Cr不锈钢FV520B不锈钢高压CO2环境低浓度H2S环境

数控机床回转刀具磨损视觉检测与控制系统

数控机床加工过程中,刀具的磨损会直接影响工件加工效果。对加工刀具磨损的及时检测,根据磨损程度进行刀补调整或刀具更换等操作,可以有效提高加工效率,降低加工成本。当前的

学位

刀具磨损检测机器视觉在机检测系统双相机边缘轮廓重构

基于表示学习的目标检测与分割算法研究

与本文相关的学术论文