结合语义和注意力机制的遮挡行人检测

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:quhongliangs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉领域重要的研究课题之一,其任务是对视频序列或图像中的行人与背景进行分类并给出行人的具体位置。近几年,基于深度学习的目标检测框架取得了极大的成功,行人检测作为目标检测任务的热门研究课题之一,其性能也取得了很大突破。然而,由于一般的目标检测算法和行人检测算法针对的目标不同,两个任务面临的挑战也不相同。在复杂情况下,尤其是在行人被遮挡、背景干扰、尺寸较小以及检测速度等问题下,基于一般目标检测框架的行人检测算法还有很大提升空间。针对上述问题,本文基于候选区域快速目标检测框架,从语义分割、特征融合、注意力机制等方面进行研究。本文完成的主要工作如下:(1)提出一种结合语义和多层特征融合的行人检测算法。首先,融合骨干网络多个卷积层特征,提取不同尺度行人特征,生成细节丰富的鲁棒性特征;然后,在融合层上添加语义分割分支,用语义特征与相应的卷积层连接作为行人目标位置的先验信息,增强行人和背景的辨别性;最后,在区域建议网络的初步回归上构建了一个行人二次检测模块,进一步排除误检物体。该算法适用于智能交通场景中行人的检测,尤其是对被遮挡的行人更具鲁棒性,基本不增加运算复杂度。(2)提出一种结合注意力机制与深层特征融合的行人检测算法。经研究发现,卷积层的不同通道特征通常对应身体的不同部位,本文充分利用这些通道信息来区分被遮挡行人与遮挡物体。首先,在多个卷积层上分别添加注意力机制和语义分割分支。注意力机制可以自动选择卷积层之间行人的语义以及有用信息,语义分割可以有效辅助检测辨别行人与背景;然后,在骨干网络最后输出层上添加竞争性注意力机制有效缓解训练网络深度增加产生的冗余等问题;最后,融合深层卷积特征组成综合行人信息输入区域建议网络,不同比例的特征映射在卷积层上,有效丰富了不同尺寸行人的特征信息。该算法在不同遮挡程度行人的检测上取得了更好的性能,尤其是对严重遮挡的行人检测。(3)在Caltech、City Persons行人检测数据集上验证所提算法性能,并与当前主流算法进行对比。在复杂场景中,本文算法在检测速度达到实时的前提下,整体提高了遮挡行人以及小尺寸行人的检测性能。
其他文献
药物研发是一项耗时较长、风险极高、耗资巨大的系统性工程,一种新药从研发到上市,其平均周期达到10-15年,耗资达数亿美元。运用计算方法能有效缩短药物研发周期,因此受到了广泛的关注。随着高通量生物数据的快速增长,基于网络的蛋白质-药物相互作用预测方法逐渐成为研究热点,然而基于网络的方法存在生物作用机制不明确的问题,同时预测性能也需要进一步提升。本文提出了一种针对DNA结合蛋白的残基三聚体和药物相互作
近几十年来,高熵合金凭借其独特的四大效应以及优异的高温性能吸引了海内外研究者们的关注,其高温氧化行为的研究无论在理论层面还是在实际中都有非常重要的意义。研究发现,CrMnFeCoNi系高熵合金的微观组织均为单一的FCC固溶体相,拥有优良的综合性能。Nb元素的加入使合金的硬度及屈服强度增强,且CrMnFeCoNiNbx高熵合金具有良好的热稳定性。本文采用不连续称重法、XRD、SEM 及 EDS 等手
多机器人图案构成是多机器人研究的热点问题,受到越来越多的关注。在实际应用中,多机器人根据不同环境及任务的要求构成期望的图案以完成诸如区域覆盖、目标搜索、编队表演等。然而现有的关于多机器人图案构成的研究大多基于理想的无障碍物环境,不能有效地应用于障碍物环境,同时为了提高图案构成效率,多机器人除了满足障碍物环境下构成期望图案还应进一步优化构成图案所用时间以及路径长度。针对以上问题,本文研究了障碍物环境
苔玉球把植物的根包在苔藓球里,是一种由盆景演变而来的古老日本艺术,已经在世界上传播开来,苔玉球的形式也出现了演变。为了制作外观最适合观赏的苔玉球及后期养护管理,1)开展了以大灰藓(Hypnum plumaeforme)和常春藤(Hedera nepalensis var.sinensis)作为试验材料,用菜园土和泥炭土、红壤土和泥炭土分别以2:3、3:2、4:1的体积比例共6组混合基质,制作成苔玉
随着智能制造2025战略的提出,基于数字孪生的智能工厂得到了越来越广泛的研究和应用。AGV智能物流配送系统实现企业生产环节物料的自动化运输,在智能工厂中起到了至关重要的作用,其中路径规划与仿真算法是车间AGV保障运行的关键算法,具有较为重要的理论意义及工程应用价值。本文以车间AGV为研究对象,对车间AGV的路径规划和仿真算法进行研究,并针对现有遗传算法和现有快速扩展随机树算法存在的问题,进行了算法
液冷系统是针对发热元件进行散热的冷却系统,致力于保证服务器的正常运行。纯铜及6063铝合金是液冷系统部件的主要材料,液冷系统的腐蚀失效形式主要是空泡腐蚀和空泡-冲刷腐蚀。本文从流速流态模拟、溶液自身腐蚀性、腐蚀薄弱环节以及腐蚀寿命评价等方面开展了空泡腐蚀和空泡-冲刷腐蚀的研究,以期为液冷系统长期服役安全提供理论指导。应用FLUENT软件对液冷系统各部件流体流态进行数值模拟,研究了不同部位流体的流速
TiC/Mg镁基复合材料作为一种轻质合金,具有质量轻、比刚度和比强度高、易切削加工、优良的阻尼性能及抗电磁干扰能力,在汽车、电子通讯、航空航天和军工等领域有着广阔的应用前景。对于金属基复合材料来说,其性能主要取决于增强相与基体两相间的界面结合状况。界面能够有效地将载荷从相对脆弱的基体中传到具有高强度、高模量的增强相中,使复合材料的力学性能得到明显提升,此外,界面的结合强度会受到许多因素的影响,如界
研发资金投入对新能源汽车企业可持续成长至关重要,但其究竟如何受诸多前因影响仍众说纷纭。依据生态系统理论将新能源汽车企业分为核心企业和配套企业。本文基于组织冗余理论和2014—2018年A股新能源汽车产业数据,研究两类企业中研发人员冗余和研发资金投入之间的关系,以及财务冗余和政府补贴的调节作用。本文发现研发人员冗余能显著促进新能源汽车企业加大研发资金投入,但财务冗余和政府补贴对两类企业的调节作用存在
复杂网络是表征和研究复杂系统的重要工具。复杂网络拓扑结构特征的研究至今仍是主要挑战,近几十年来受到了来自不同学科领域不同团体的广泛关注。2005年,复杂网络的分形特性和自相似性被揭示。分形特性被认为是继小世界性和无标度性之后的第三大复杂网络基本拓扑结构特性,也因此成为了复杂网络的一个重要研究方向。本文重点研究复杂网络的分形维数及其应用,主要研究工作有以下几个方面:(1)介绍和整理了国内外复杂网络分