面向目标定位的选择性注意强化学习算法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:chuanguowuhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标定位一直是计算机视觉领域较为热门的研究点,单纯基于深度学习的目标定位网络,是通过大量的卷积结构对图片特征提取,然后枚举目标可能存在的区域,最后对这些区域进行检测。这种方法效率低,消耗过多资源。深度强化学习是一种基于策略的方法,通过不断试错,能够学习到完成任务的最优策略。现有的深度强化学习方法大多基于时间差分法,通过随机预设一个包围框,然后通过不断变形包围框最终定位目标。这种方法在随机生成的包围框时,需要大量冗余的计算。选择性注意强化学习基于蒙特卡洛方法,将注意力机制与深度强化学习结合,让智能体对目标有选择性的关注。因此以深度强化学习为主体,使用硬注意力机制、蒙特卡洛、策略梯度等方法,不仅可以减少参数量,建立轻量级网络,而且能够快速完成检测;以双阶段检测为主思路,使用多智能体联合探索,不仅能够加速检测过程,而且能够以较高精度完成多目标检测任务。基于以上思想,本文提出了以下两种带有选择性注意机制的深度强化学习模型:1)提出了一种选择性区域注意强化学习目标检测网络RARL。人在观察图片时,首先选择性关注图片的局部区域,然后结合以前的经验在大脑中进行组合,最后通过思维做出判断,RARL模型便是基于此逻辑。该模型以循环网络结构为主要框架提取特征,并将历史信息与当前信息融合。在每一个循环的时间步中,它都可以关注融合后的信息,尤其是可能有目标的信息。2)提出了一种多智能体联合选择性多目标定位网络MRARL。首先通过多个RARL网络联合选择性定位目标物,然后通过回归定位部分对第一阶段定位结果进行细化。其中在选择性定位阶段,为了协调各个智能体之间的检测策略,加入了门控制机制,不仅可以帮助智能体之间的有效交流,而且能够防止信息无条件传递导致信息组合爆炸。
其他文献
柑橘是我国一种非常重要的经济作物,种植面积很广,但8年以上的童期,严重制约了柑橘的育种进程。因此,如何缩短幼龄是果树分子生物学研究的热点和难点。而FLOWERING LOCUS C(FLC)是抑制柑橘开花的关键基因,一般通过抑制FLC的转录及其蛋白质表达水平,从而促进柑橘开花。CRISPR/Cas9在基因编辑技术上已显示出其优越性,并已迅速应用于多种生物体的研究。与TALENS/ZFNs的基因组编
学位
信息技术的发展日新月异,越来越多的复杂装备亦朝着信息化发展,自行火炮作为典型的复杂装备而言,其自动化、集成化与复杂化程度也在日益增加,因此对自行火炮进行故障诊断研究就十分必要。传统针对自行火炮的故障诊断方法需要依赖大量的人力资源与专家知识,这无疑增加了进行故障诊断的时间复杂度。得益于机器学习的发展,以数据驱动为内核的故障诊断技术逐渐映入研究者眼帘,根据自行火炮状态数据建立合适的机器学习模型,进而可
学位
GIGANTEA(GI)作为植物生长发育过程一个重要的基因,它编码一种核蛋白。本实验主要从Cl GI基因及启动子入手研究GI在柑橘成花及干旱胁迫中的功能及调控机制。从柠檬中克隆出Cl GI基因,分别构建了超表达载体、CRISPR载体和其启动子融合GUS蛋白载体,随后进行拟南芥、烟草及柠檬的遗传转化。主要研究结果如下:1.从柠檬中克隆Cl GI基因,测序后发现Cl GI有两个转录本,转录本和剪切本分
学位
猕猴桃是呼吸跃变型水果,采收后果实的硬度呈下降趋势,其软化程度是判段果实成熟度的重要指标。淀粉降解与猕猴桃果实软化的关系十分密切,直接影响到果实的贮藏性和货架期。淀粉合成并储藏于淀粉体中,因此研究猕猴桃果实淀粉体中淀粉代谢对于揭示淀粉降解与果实软化具有重要的理论意义和应用价值。本研究以美味猕猴桃海沃德(Actinidia deliciosa Hyward,HWD)、中华猕猴桃金果(Actinidi
学位
传统的目标检测算法通常使用滑动窗口进行区域选择,提取所选区域中的特征向量输入到分类器中完成分类。这会造成大量窗口冗余,降低算法效率。后来学界广泛使用基于深度学习的算法,其多是通过卷积核遍历图像中的特征向量,完成检测任务。相比较于传统算法,虽然基于深度学习的检测算法极大的提高了目标检测的精度,但是该算法通过遍历所有特征向量完成检测任务,而在一张图片中,最有用的信息往往仅存在于目标周围的区域。因此,遍
学位
在获取图像的过程中,由于光照环境弱拍摄设备故障以及传输器件老化等外界因素,图像会出现信息受损或是质量畸变等退化现象。图像模糊是经典的图像退化问题,文中主要研究运动模糊图像复原任务,运动模糊产生的主要原因是由于物体与相机产生相对位移导致像素点发生变化。随着深度学习的快速发展,已经形成使用参数化的框架得到清晰图像,CNN网络通过叠加卷积核实现不同程度像素模糊的复原需求。本文算法是以SRNDeblurN
学位
柑橘是世界和我国南方地区最重要的鲜食水果。近10年来,通过品种结构调整、区域气候优势互补、栽培和采后生产技术创新等综合措施,现已基本实现了国产鲜食柑橘的周年供应,但贮运保鲜等采后生产依然是柑橘产业链的短板。水分是影响柑橘果实贮藏寿命和销售外观品质的决定因素。本实验室前期的研究发现水通道蛋白(Aquaporins,AQPs)介导的水分的转运和消耗是引起柑橘采后耐贮藏性能差异的源头因素,但具体的调控机
学位
中国是柑橘重要原产地之一,柑橘资源丰富,有4000多年的栽培历史。柑橘胚性愈伤组织不仅可以长期离体保存,也是通过细胞融合创制新种质和建立柑橘可再生基因编辑体系的珍贵试材。因此,诱导和保存状态良好的胚性愈伤组织是柑橘生物技术改良的常规和必要工作。细胞融合技术可以有效缩短育种年限,实现核基因组和胞质基因组重组。柑橘细胞融合过程中,线粒体总是定向来自愈伤组织亲本,但其内在机制仍不清楚。基于以上背景,本研
学位
随着计算机视觉领域的不断发展,仅在二维图像上进行图像处理的相关研究已经不能满足日益复杂的任务需求,为了能够进一步提高各类图像处理研究的精度,深度信息的加入不可或缺。然而在日常图像采集的过程中,难以创造使用高精度深度测量设备获取实际深度信息的条件,因此利用深度估计技术获取二维图像深度信息是一个至关重要且具有广阔应用前景的研究课题,而使用深度学习方法进行深度估计的研究又能快速、准确、端到端地获取到图像
学位
当下无线电定位技术在生活中应用广泛,室内定位始终是其中的热点研究的对象。无线电在室内环境传播相较于室外空旷环境更易出现因为多径或者非视距环境等情况而增大定位误差。论文以超宽带(Ultra-Wide Band,UWB)技术为定位实现的基础,依靠其良好的穿透力与稳定性提高定位系统在室内定位的精度。论文研究了UWB的定位算法,设计了移动机器人的定位跟随系统,实现了可随标签进行定位与跟随移动的机器人平台。
学位