基于视觉机制和深度学习的目标检测技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:huapdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类视觉系统对于外界信息的处理精确而复杂,可真实而高效地感知外部环境,进而快速而准确地识别出不同场景内的目标。近年来,更多学者开始探究生物视觉感知高效性的内在机理,借助神经科学形成了相应的衍生理论如深度学习等,并将其运用到图像的相关目标检测任务中。本文从实际应用出发将图像目标具体化,首先面向自然图像中的目标轮廓,构建双侧注意通路交互响应与融合模型;接着面向视网膜图像中的目标血管,构建双通道非对称卷积神经网络模型;最后面向眼底病变图像中的目标出血点,将血管检测任务中的网络模型调整后迁移到该类检测任务中。本文的主要研究内容如下:(1)建立双侧注意通路交互响应与融合模型,并将其应用到自然图像的目标轮廓检测中。首先根据视皮层下神经元的颜色拮抗机制,构建一种基于局部亮度特征的单拮抗动态调节模型,实现亮度边界和颜色边界的联合编码;接着模拟初级视皮层经典感受野的多方向微动机制,利用最佳方位区间的多方向微动来实现方向选择的精细化;然后结合视觉注意机制与视觉信息双侧分流机制,构建基于双侧注意通路的视觉信息交互响应模型,分别获取背侧空间显著轮廓和腹侧神经元稀疏响应;最后引入高级视皮层的多通路信息融合机制,通过背侧流与腹侧流之间的信息差异来增强显著轮廓。以BSDS500、NYUD、Ru G40图库中的自然图像作为实验对象,选用全局最佳(ODS)、单图最佳(OIS)、平均精度(AP)及F值作为评价指标。结果表明,相较于SCO、SED、BAR等主流方法,本方法的准确性更高且稳定性更好;同时BSDS500数据集上的ODS、OIS、AP分别为0.69、0.71、0.70,整体性能优于对比方法。(2)建立双通道非对称卷积神经网络模型,并将其应用到视网膜图像的目标血管检测中。首先根据眼底血管的形态差异,分别建立主/细血管特征提取模块,在血管方向最佳匹配角下采用多尺度的二维Gabor滤波器,自适应地提取表征目标特性的主/细血管特征图;然后考虑到单通道网络结构不利于粗细血管的统一表征,在U-Net基础上构建双通道网络模型,其中主血管分割网络(Main Segment-Net)采用逐级连接模式对主血管进行快速定位和分割,细血管分割网络(Fine Segment-Net)采用空洞卷积和跳跃连接相结合的模式对细血管进行精细提取;最后将非对称结构的双通道网络模型结合,以细血管分割图补全Main Segment-Net分割过程中被忽略的细节信息,实现双通道之间的信息互补。以DRIVE、CHASE_DB1数据集中的眼底图像作为实验对象,选用准确率(Acc)、灵敏度(SE)、特异性(SP)作为评价指标。结果表明,相较于U-Net、CDNet等主流方法,本方法的分割结果在主体上更加完整且连续;同时DRIVE和CHASE_DB1数据集上的Acc、SE、SP分别为96.3%、87.45%、98.23%和96.94%、89.16%、97.94%,分割精度优于对比方法。(3)为验证本文Fine Segment-Net模型的适应性,将其融合注意力机制并应用到眼底病变图像的出血点检测中。首先根据眼底出血点的局部特征和尺寸差异,构建数据预处理模块,利用CLAHE算法对暗病灶区域进行局部增强和对比度限制;同时通过高斯金字塔对特征增强后的病变区域进行尺度分解,利用多尺度层次的局部特征来表示尺寸不一的出血点。然后改进Fine Segment-Net模型,依次将多尺度特征增强图作为输入;同时引入注意力模块替代原本的跳跃连接模块,通过多次卷积运算和Re Lu函数激活来实现编解码路径之间的跨级连接。最后将不同尺度的出血点预测图融合,以不同分辨率的像素叠加来得到目标出血点。以IDRi D、DDR数据集中的眼底病变图像作为实验对象,选用Acc、SE、SP作为评价指标。结果表明,本方法的检测结果较为全面且准确;同时Fine Segment-Net模型在多尺度病理特征融合下得到的出血点,相较于单尺度具有更好的检测效果。
其他文献
电子战(EW)也称为电子对抗,是敌对双方争夺战场电磁频谱的斗争,电子对抗技术是当代信息化战场上十分关键的作战力量之一。其中,电子侦察中的检测与估计技术是电子战成功实施电子攻击和防护的首要任务和先决条件。然而,随着军事电子信息技术的快速发展,战场电磁频谱呈现动态、多变、密集、复杂等特征,给传统的检测与估计方法带来了前所未有的挑战。与此同时,深度学习技术快速发展,其相关技术在电子对抗中的应用也成为了当
无论是在家庭还是学校,每天都发生着许许多多的小事,一个眼神、一句话语、一个手势等都可能对孩子产生莫大的影响。教育现象学就是一门探讨成年人与孩子如何相处的学问,回答“对于这个孩子,此时此刻我该怎么做才是最好的”。然而,所谓此时此刻的正确反应往往不是周密思考的结果,而是取决于教师感知学生的敏感性。教育不是教知识,
期刊
路径寻优是一种较为经典的优化问题,其主要内容是通过智能优化算法合理规划出一条从起始地到目标地的最优路径。群智能优化算法(Swarm Intelligence,SI)是一种新兴的元启发式技术,具有原理简单、易实现等特点。近年来,出现了许多新颖的SI算法,例如哈里斯鹰优化算法(Harris Hawks Optimization,HHO)。HHO算法是受哈里斯鹰捕食行为启发而提出的一种新的SI算法,具有
由于信号中的信息存在一定的冗余,假使根据奈奎斯特采样率对信号进行采样,会造成带宽不可避免的“浪费”,同时还可能增加信号采集、处理方面的设备成本。而假设信号存在一定稀疏性的情况下,根据压缩感知理论,信号可以先经过一定的测量过程而实现压缩。测量过程中,信号的采样率可以远低于其奈奎斯特采样率。因此可以说压缩感知一定程度上“突破”了奈奎斯特采样定律对模数转换的限制,针对通信领域中载波频率不断提高的现状,压
大规模多输入多输出(Massive Multiple-Input Multiple-Output,Massive MIMO)自问世以来,以其分集增益和空间增益特性,被广泛应用在网络需求大的场景中。随着技术的变革,通信设备数目快速增长,基站集成的天线数量也随之增加,这就导致了整个系统的功耗巨大。因此,如何降低系统功耗,发展绿色通信已经成为当今研究的热点。在此背景下,本文针对大规模MIMO系统的能效优
逆向调制(MRR)自由空间光通信(FSO)系统是一种基于逆向反射器的非对称FSO系统,既避免了传统无线射频通信系统面临的频谱资源紧张、传输速率及安全保密性不够高的问题,又能克服传统FSO系统终端功耗大、体积大的缺点。然而,MRR FSO通信需要在大气信道中进行往返两次传输,会受到两倍大气湍流的影响,带来更加严重的光束漂移及光强闪烁等光学畸变现象,从而降低系统的稳定性和可靠性。因此,为了进一步提高M
基于世卫组织给予的数据中,每年交通事故发生的次数不尽其数。其中,疲劳驾驶是其中一大致命因素。在2005年的中国交通事故统计报告提到的47起事故中,因疲劳驾驶导致7起。疲劳驾驶不仅是在伤害自己同时也在伤害他人。为了尽可能地避免疲劳驾驶的事故发生,疲劳驾驶状态检测极其重要。对此,研究疲劳驾驶状态检测具有深刻意义与举足轻重的价值。为了在驾驶过程中能够有效地进行实时检测,本文基于MobileNet-V3轻
为了进一步提升电机驱动系统的功率密度与效率,降低系统的体积与成本,电机与驱动电路的集成化技术逐渐成为研究人员的关注热点。磁功能集成电机驱动的概念指电机与驱动电路共享磁性元件实现各自运行所需的不同功能,从而为系统减少磁性元件的数量。然而磁功能集成电机驱动方案中电机和驱动电路同时包含功率耦合和磁耦合,无法用传统思路独立设计。确定电机励磁绕组参数是解决这一问题的关键。针对此问题,本文提出一种将驱动电路设
随着互联网技术的发展、应用的快速普及,不受时空限制的线上教学风起云涌,特别是受新冠疫情的影响,人们对于无接触式的线上教学的需求变得更加迫切。线上教学打破了时间空间限制,使人们的学习更加自由便捷。但相比于传统课堂,在线课堂环境下师生互动性差,沟通存在一定障碍,教师很难有效监测到学生的学习专注度,学生也可能会因为没有监督而学习效率下降。基于此,本文结合网络线上教学环境的特点,提出了一种视觉特征融合的注
互联网经济的发展,推动着传统物流模式不断变革升级。同时,人口老龄化加剧以及新冠疫情在全球范围内的爆发与持续蔓延,使得高度自动化的智慧物流成为迫切需求。以托盘叉车AGV为代表自主移动机器人在物流业的应用越来越广泛,高重复性和高强度的任务逐步被机器人完成。物流仓储环境复杂多变,由于托盘叉车AGV缺乏对装载目标的自动识别与局部定位能力,智慧物流搬运环节在很大程度上还无法实现完全自动化。本文以托盘叉车AG