基于深度神经网络的遮挡目标的检测与实现

来源 :扬州大学 | 被引量 : 0次 | 上传用户:xylzsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,人工智能已经是当今社会人人皆知的热门词汇,人工智能概念渗透着各行各业,而机器视觉又是实现人工智能不可或缺的一个技术方面,图像应用的重要性不言而喻。计算机通过目标检测技术解读图像内容,而遮挡问题是现实生活中常见且不可避免的现象,所以对遮挡目标的检测既是目标检测的一个重要分支,也是一个亟待解决且具有深厚研究意义的课题。本论文主要以SSD目标检测算法为基础,针对密集同种目标互相遮挡和复杂环境背景下被其它干扰项遮挡的目标检测问题,以行人目标和车辆目标为例,进行深入的研究。具体成果如下:1、提出了基于改进NMS(非极大抑制)的遮挡目标检测算法。NMS作为目标检测中去除重叠度较大的冗余预测框,确定最后剩余预测框就是真实目标位置的的关键一步,传统NMS对于处理两个非常相近的目标时,分数较低的框会因为与当前得分最高框的交并比大于预设阈值而被直接抑制,出现漏检问题。提出的算法在soft-NMS中新增一个阈值进行权值惩罚思想的基础上,进一步地预设第二个阈值来删除部分交并比过大的待检测框,这样可以减小同一目标被重复检测的概率。再通过设定第三个阈值,直接从各处分离的密集目标并行NMS算法以减少检测时间。实验结果表明,该算法对于解决同类密集遮挡目标的漏检,错检和重复检测问题有了效果提升。2、提出了基于增强Repulsion Loss和Inception-ResNet-v2的遮挡目标检测。将Repulsion Loss损失函数思想融入SSD算法中原始损失函数,Repulsion Loss通过组合一个缩小吸引项距离和加大两个排斥项距离的优势功能,来增强SSD算法的预测能力来防止遮挡目标的漏检和误检。由于Repulsion Loss本身是应用于密集行人检测上的,通过分析Repulsion Loss的思路并实验探究其应用于其它密集目标检测的通用性,以车辆目标为对象验证想法,延伸Repulsion Loss在一般遮挡目标的检测应用。对Repulsion Loss的不足进行分析,灵活科学地调节排斥项的比重以增强Repulsion Loss的作用。另一方面,从SSD网络的特征提取特点入手,着眼于SSD网络中生成六张特征图的六个普通的卷积层,使用Inception-ResNet-v2网络内改变其特征生成方式,使得特征图包含更丰富的信息,这其中包括更多关于遮挡目标的特征信息,更好地检测出遮挡目标和区分其它干扰项目标。还有,利用经典数据集训练新建的算法模型,之后再加入自建数据集形成混合数据集再次进行实验。实验结果表明,该算法对密集情况产生遮挡目标检测和复杂环境背景产生的遮挡目标检测具有很好的准确性,模型的泛化能力也得到进一步的提高。3、进行了目标检测软件的设计及实现。本软件基于Python语言编写,使用Pyqt5类设计界面,使用Opencv视觉库设计次要功能,将训练好的模型嵌入软件中,实现对道路交通图像中行人和车辆的目标检测功能。
其他文献
随着网络通信技术的快速发展,无线智能设备的大规模普及,移动数据流量的爆炸式增长,在接入点(Access Point,AP)上部署内容缓存被认为是有前景的研究方向。尤其是在AP密集部署的网络场景下,边缘缓存不仅可以有效减轻回程链路的负载,还可以缩短用户的下载时延。然而,设计无线边缘的缓存策略是具有挑战性的,内容的流行度与用户的偏好是影响缓存命中率的重要因素。AP使能缓存之后,关联策略也将发生改变,仅
图像翻译旨在将图像从源域转换到目标域。近年来,生成对抗网络在多种图像翻译任务中取得了显著成功。不过,这些方法在生成细节纹理方面仍然面临很大的挑战。这主要是因为,现有方法普遍忽略了图像结构信息对于转换过程的指导作用;且通常采用单一的生成器结构,难以描述图像中不同尺度、不同层次的结构细节。因此,本文首先提出了一种结构辅助的生成对抗网络,并将其应用于人脸照片-素描转换任务;然后,提出了一种基于异构互补网
近年来人工智能技术的快速发展,促进了移动机器人技术的突破与落地,尤其在移动机器人室外导航方法与应用方面的研究深受关注。移动机器人越来越多的出现在工业区、购物商场、校园等地方,在未知环境中如何保证移动机器人具备自主导航能力,依然是一个挑战性的研究问题。本文针对未知室外环境下移动机器人自主导航问题,研究了基于人机交互系统的全局路径规划、基于多传感器的全局自主定位与导航、以及基于双目视觉的场景语义分析和
上市公司高级管理人员变更与企业成长性关系的研究是现代企业治理的重要组成部分。在企业治理有效的前提下,企业成长性的相关指标可以作为衡量高级管理人员经营管理水平高低
随着互联网技术的飞速发展,个人信息安全的重要性越来越被重视。传统的身份验证方式以用户名密码为主,存在着诸多缺点,使得用户的个人信息有被入侵的风险。与此同时,生物识别
“百善孝为先”,中华民族以孝著称于世,孝文化在中华文化中具有举足轻重的地位。当前社会,“孝亲敬老”的优良道德传统面临沦丧的危机。重塑“孝亲敬老”的社会风气迫在眉睫
随着经济快速发展和国家对旅游经济的大力推动,旅游业已成为国民经济战略性支柱产业。随着可支配收入的增加以及闲暇时间的增多,外出旅游已成为一种常见的休闲娱乐方式,旅游消费需求也开始由粗放式转变为注重大众化、多样化、自助化、体验化的多元方式。近年来,日照海之韵旅游度假中心为了应对客流压力,不断加强服务质量管理,但是与游客快速增长的多元化需求相比,旅游服务过程中仍然存在大量问题,导致游客整体游览感知差距大
自从无线通信以来,相干通信就一直统治着无线通信的世界。相干系统比起非相干系统提供了许多好处。同时,相干光通信系统在上个世纪的1980年代和1990年代初期一直是研究的重点。此外随着光纤放大器等器件与工艺的进步,基于数字信号处理的相干光通信系统被广泛认为是最有希望的下一代长途传输系统。构建系统的挑战之一是实现处理。目前以串行结构为主流的DSP(数字信号处理)算法需要进行并行化实现实时处理。本文主要的
建国以来,在学校场域中以教研组或备课组的方式开展合作研究是我国教师日常专业发展的基本方式,也为教师专业学习共同体提供了基本发展平台。近年来,学校变革成为我国社会转
当今社会,科技发展越来越迅速,随着机器人相关技术的发展,人工智能开始广泛的出现在人们的生活中。其中计算机视觉是人工智能中最为重要的组成部分,手机支付的人脸识别,服务机器人涉及的场景识别和目标检测等等,都是计算机视觉的最常见应用,可见计算机视觉的相关技术已经进入人们的日常生活了。本文针对计算机视觉的两个方向,场景识别和目标检测技术进行了研究,具体内容如下:针对局部场景识别的问题,本文以Mean Sh