双目机器视觉及RetinaNet模型的路侧行人感知定位

来源 :中国图象图形学报 | 被引量 : 0次 | 上传用户:tkartist
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 行人感知是自动驾驶中必不可少的一项内容,是行车安全的保障.传统激光雷达和单目视觉组合的行人感知模式,设备硬件成本高且多源数据匹配易导致误差产生.对此,本文结合双目机器视觉技术与深度学习图像识别技术,实现对公共路权环境下路侧行人的自动感知与精准定位.方法 利用双目道路智能感知系统采集道路前景图像构建4种交通环境下的行人识别模型训练库;采用RetinaNet深度学习模型进行目标行人自动识别;通过半全局块匹配(semi-global block matching,SGBM)算法实现行人道路前景图像对的视差值计算;通过计算得出的视差图分别统计U-V方向的视差值,提出结合行人识别模型和U-V视差的测距算法,实现目标行人的坐标定位.结果 实验统计2.5 km连续测试路段的行人识别结果,对比人工统计结果,本文算法的召回率为96.27%.与YOLOv3(you only look once)和Tiny-YOLOv3方法在4种交通路况下进行比较,平均F值为96.42%,比YOLOv3和Tiny-YOLOv3分别提高0.9%和3.03%;同时,实验利用标定块在室内分别拍摄3 m、4 m和5 m不同距离的20对双目图像,验证测距算法,计算标准偏差皆小于0.01.结论 本文提出的结合RetinaNet目标识别模型与改进U-V视差算法能够实现对道路行人的检测,可以为自动驾驶的安全保障提供技术支持,具有一定的应用价值.
其他文献
目的 通道注意力机制在图像超分辨率中已经得到了广泛应用,但是当前多数算法只能在通道层面选择感兴趣的特征图而忽略了空间层面的信息,使得特征图中局部空间层面上的信息不能合理利用.针对此问题,提出了区域级通道注意力下的图像超分辨率算法.方法 设计了非局部残差密集网络作为网络的主体结构,包括非局部模块和残差密集注意力模块.非局部模块提取非局部相似信息并传到后续网络中,残差密集注意力模块在残差密集块结构的基础上添加了区域级通道注意力机制,可以给不同空间区域上的通道分配不同的注意力,使空间上的信息也能得到充分利用.同
10月27日,湖北省无线电监测中心随州监测站联合市公安局东城派出所,在市东城办事处一小区楼顶查获一套无人值守的“黑广播”.rn当天,湖北省无线电监测中心对移动监测车进行了改造升级,之后进行测试时发现频率为93.2MHz的调频广播信号正在播放非法药品广告,经比对频率台站数据库,确认其为“黑广播”.之后,监测站迅速启动非法信号查处应急预案,组织技术人员利用刚改装升级的移动监测车和便携式监测设备,对该“黑广播”进行测向定位,最终将其锁定在市东城办事处某住宅小区3号楼楼顶的水箱处.
期刊
机器的情感是通过融入具有情感能力的智能体实现的,虽然目前在人机交互领域已经有大量研究成果,但有关智能体情感计算方面的研究尚处起步阶段,深入开展这项研究对推动人机交互领域的发展具有重要的科学和应用价值.本文通过检索Scopus数据库选择有代表性的文献,重点关注情感在智能体和用户之间的双向流动,分别从智能体对用户的情绪感知和对用户情绪调节的角度开展分析总结.首先梳理了用户情绪的识别方法,即通过用户的表情、语音、姿态、生理信号和文本信息等多通道信息分析用户的情绪状态,归纳了情绪识别中的一些机器学习方法.其次从用
本文分析讨论了三种监测测向固定站的信号传输方案,通过多个维度的分析比较,指出基于光纤数字化传输的方案,在高频段信号监测和测向中具有提升监测灵敏度、便于测向控制、节省成本等明显优势,可作为后续固定式监测测向站的设计参考.
目的 多曝光图像融合(multi-exposure fusion,MEF)是利用一组不同曝光度的低动态范围(low dynamic range,LDR)图像进行合成,得到类似高动态范围(high dynamic range,HDR)图像视觉效果图像的过程.传统多曝光图像融合在一定程度上存在图像细节信息受损、边界不清晰以及部分色彩失真等问题.为了充分综合待融合图像的有效信息,提出了一种基于图像分解和色彩先验的双尺度多曝光图像融合方法.方法 使用快速导向滤波进行图像分解,分离出细节层对其进行增强处理,保留更多
1前言rn按照《国家无线电管理规划(2016-2020年)》的要求,需要建设省级无线电管理一体化平台,完善频率、台站、监测、设备以及地理环境等各类基础数据库,实现数据的规范化和标准化,确保数据完整性、实时性和准确性,逐步实现数据共享.本文重点研究探讨省级无线电管理一体化平台的设计与实现.
期刊
目的 由于分类对象具有细微类间差异和较大类内变化的特点,细粒度分类一直是一个具有挑战性的任务.绝大多数方法利用注意力机制学习目标中显著的局部特征.然而,传统的注意力机制往往只关注了目标最显著的局部特征,同时抑制其他区域的次级显著信息,但是这些抑制的信息中通常也含有目标的有效特征.为了充分提取目标中的有效显著特征,本文提出了一种简单而有效的互补注意力机制.方法 基于SE(squeeze-and-exci-tation)注意力机制,提出了一种新的注意力机制,称为互补注意力机制(complemented SE,
目的 符合曼哈顿假设的结构化场景简称曼哈顿世界,具有丰富的场景结构特征.消失点作为直线的潜在观测,是一种全局信息,可以显式地体现载体坐标系与世界坐标系之间的姿态关系.为更加准确地估计消失点,本文针对单目图像,同时考虑实时性和准确性,提出了具有更高精度的基于非线性优化的消失点估计算法.方法 分析目前性能最优的基于随机采样一致性(random sample consistency,RANSAC)的消失点估计方法,通过对直线单参数化、利用正交性约束生成候选假设以及RANSAC过程的重点分析与改进,更加快速准确地
目的 高光谱人脸数据具有丰富的鉴别信息.最优谱带选择和谱内间特征表示是高光谱人脸识别的关键.基于高光谱波段范围为400~1090 nm和采样间隔为10 nm的高光谱成像人脸数据,本文提出一种分块谱带选择和VGG(Visual Geometry Group)网络的高光谱人脸识别方法.方法 为了优化适合人脸识别的谱带组合,基于人脸关键点,提出分块局部二值模式(local binary pattern,LBP)特征的AdaBoost支持向量机(support vector ma-chine,SVM)谱带选择方法
目的 现有显著性检测方法大多只关注显著目标的中心信息,使得算法只能得到中心清晰、边缘模糊的显著目标,丢失了一些重要的边界信息,而使用核范数约束进行低秩矩阵恢复,运算过程冗余.为解决以上问题,本文提出一种无监督迭代重加权最小二乘低秩恢复算法,用于图像视觉显著性检测.方法 将图像分为细中粗3种尺度的分割,从细粒度和粗粒度先验的融合中得到分割先验信息;将融合后的分割先验信息通过迭代重加权最小二乘法求解平滑低秩矩阵恢复,生成粗略显著图;使用中粒度分割先验对粗略显著图进行平滑,生成最终的视觉显著图.结果 实验在MS