自然场景下的小目标交通标志检测技术研究

来源 :南京邮电大学 | 被引量 : 1次 | 上传用户:fzflash
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着城市道路的交通压力和人们对高科技生活的追求,智能驾驶系统一直是重要的研究内容,作为该领域的重要分支之一,交通标志检测技术的研究也同等重要。现如今的交通标志检测主要面临着检测对象目标小、检测场景复杂、实时性检测差等挑战。对于这些问题,本文选择以卷积神经网络为工具来进行研究。为提高特征的学习能力,本文以基础的检测网络为框架,并加强特征提取的深度,通过不同尺度特征融合和多级预测来提高特征的利用率。对于检测实时性差的问题,本文采用单阶段目标检测方法。本文的主要内容为:(1)对于道路中交通标志检测存在的检测对象目标小、自然环境干扰等问题,提出了基于FCOS算法改进的多尺度特征融合的检测网络——FCOS-t网络。选用FCOS算法为框架,在主干特征提取网络中引入了注意力模块CBAM,并引入模型效果更优的Swish激活函数。在特征加强网络中进行轻量级的多尺度特征融合。根据交通标志的场景特性,有效删减了FCOS原算法对模糊样本的处理,减少了检测网络的部分冗余。实验结果表明,在TsinghuaTencent 100K数据集上,和其他交通标志检测算法进行了实验数据的对比分析,证明了FCOSt网络的有效性。(2)为了实现交通标志检测在智能驾驶系统的工业落地,提出一个响应速度快的轻量化网络模型——m-YOLOX网络。该网络以YOLOX算法作为框架,采用更轻量化的Mobile Net V3网络,将Mobile Net V3的有效特征层来替换原算法中的CSPDark Net的特征层,并使用深度可分离卷积来代替YOLOX中的普通卷积,以此来减少网络模型的参数量。最后将m-YOLOX网络改进前后的算法在Tsinghua-Tencent 100K数据集上进行对比实验,证明了该网络的可行性和有效性。(3)根据FCOS-t网络模型和m-YOLOX网络模型的应用场景,分别导入FCOS-t模型和m-YOLOX模型,设计了一个便于操作的交通标志检测平台系统。详细介绍了系统的框架和操作流程,并对操作平台系统的图片检测功能和实时视频检测功能的实现做了详细的分析,最后,对检测平台的不同功能进行测试,并通过可视化页面展示操作结果,证明了系统操作的可行性。
其他文献
量子对话是基于双向传输信息的思想,即通信双方可以互相发送信息。但最初的量子对话协议存在信息泄露的安全漏洞。并且,与其它量子通信方式类似,在实际实验设备中,量子对话也可能会受到非理想实验设备的攻击。为了抵御所有可能对测量设备的窃听攻击,研究人员引入了测量设备无关的量子对话(MDI-QD)方案。但是在现有的方案中,通信的效率相对较低。除此之外,通信双方之间的参考系对齐是量子通信中的必要条件。但在实际环
学位
石墨烯是一种具有光谱吸收范围宽、载流子迁移率高和响应速度快等优异性能的新型零带隙半金属二维材料,在电子信息、材料、微纳加工、能源、生物医学等领域具有重要的应用前景,被认为是未来革命性的材料。然而,石墨烯零带隙能带结构,使其光吸收能力相对较弱(在较宽波长范围内吸收率仅为2.3%),并且还存在增益机制小以及载流子复合速率较快等不足,从而限制了纯石墨烯在光电探测器方面的应用。而半导体量子点材料因具有吸收
学位
古斯汉森位移(Goos-H(?)nchen shift,GH位移)是指反射光束相对于入射光的横向位移,它在传感、探测和信息传输等领域中有着广泛的应用。作为一种二维材料,单层石墨烯因其独特的能带结构而具有优异的光电特性,它的高度可调的光学性质为增强和调谐GH位移提供了优良的条件,使GH位移在光学应用领域具备更大的潜力。本文利用严格耦合波分析法、传输矩阵法以及静态相位法,研究了几种含单层石墨烯的复合结
学位
光学Tamm态(Optical Tamm states,OTS)是由固体物理中的Tamm态类比而来的,广泛存在于一维光子晶体异质结和金属-光子晶体结构中。通过在金属-介质-金属(Metal-Dielectric-Metal,MDM)波导中引入金属-光子晶体和金属-布拉格光栅结构,也能够实现OTS以及类光学Tamm态的激发。基于MDM波导结构中的OTS或类光学Tamm态,完成了如下微纳光子器件的设计
学位
人脸表情识别技术通过识别输出给定静态图像或动态视频序列中的表情分类来确定人的心理状态,从而实现计算机对人类表情的识别理解,这从根本上改变人与计算机的关系,使得计算机能够为人类提供更高级的服务。传统方法中使用的手工设计提取的特征通常缺乏对光照、姿态等因素的泛化建模能力,可能在一些实验室小数据集上的效果不错,但现实场景中的应用效果较差。而深度神经网络具有非凡的特征提取能力和高维度数据处理能力,因此目前
学位
行人检索的目的是在行人视频或图像中筛选出带有特定属性的行人。由于深度学习的迅猛发展,行人检索算法在过去的十年间取得了重大突破。基于深度学习的行人检索算法在刑侦破案、智能监控等领域中得到了广泛的应用。本文立足于深度学习在行人检索算法中的研究,主要工作如下:(1)提出了一种基于异构模型的Mutual Mean Teaching算法用于无监督行人重识别。针对Mutual Mean Teaching算法的
学位
非正交多址接入技术允许多个用户同时共享一个频谱资源,显著提高了频谱效率,为下一代移动通信技术提供了技术支撑,成为了当下通信领域的研究热点。在非正交多址接入技术中,多个用户可以复用在同一个频段上,但是由于接收机的解码能力有限,不可能将所有的用户同时复用,所以会将全部用户分组,组内用户使用非正交多址接入技术,组间采用正交多址的方式以降低系统复杂度。因此非正交多址接入技术中,如何进行用户配对问题成为了研
学位
随着生产装备过程的日益复杂,单体的非线性系统模型已经不能满足现代工业生产的建模需求。互联非线性系统由于能够描述复杂的工业生产过程,已经引起了许多学者的关注。互联非线性系统由若干个相互连接的子非线性系统构成,具有耦合和不确定性等特点。在互联非线性系统中,时滞或执行器故障对子系统稳定性造成的影响会通过相互作用传递给其他子系统。因此,研究互联非线性系统在出现时滞和执行器故障情况下的控制策略具有重要意义。
学位
我国正处在大发展大变革大调整时期,国际形势错综复杂,国内改革任务任重而道远,国际人才竞争日趋白热化,世界各国都意识到人才在国际竞争中的重要性,人才是一个国家综合实力提升的重要保障。我国历来重视对于人才的培养,改革开放以来,我国经济社会对人才的渴求日益增长,1978年十一届三中全会之后,中央便将“尊重知识、尊重人才”确立为我国的国策;2007年将人才强国战略作为发展中国特色社会主义的三大基本战略之一
学位
随着科技的进步和智慧城市的发展,人们对公共安全的需求不断提高,海量视频监控系统已经广泛部署在机场、社区、街道、商场等公共场所,如何高效智能化地分析拍摄的海量视频及图像数据从而实现安防监控与刑事侦查,成为当下研究热点。作为智能视频监控系统中的一种前沿技术,行人重识别受到了学者们的青睐,其主要任务是匹配多摄像头下的同一目标行人。近年来,随着深度学习技术的不断发展,行人重识别领域出现了大量的研究成果。然
学位