基于深度学习的目标检测与图像着色研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:wxlcc1026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着神经网络的不断发展,以深度学习为基础的各类目标检测算法应运而生,并广泛应用于行人检测、目标追踪和无人驾驶等领域。YOLO目标检测算法因其检测速度快而成为实时目标检测技术中的研究热点。而目标检测所应用的公共场所监控画面、医疗影像结果以及防空预警中的红外摄像等,普遍为黑白图像,为了突出黑白图像中的检测目标,对图像着色技术也有很强的应用需求。本文针对YOLO目标检测算法和着色技术进行研究,主要内容如下:1、在目标检测中,检测速度和准确性是衡量其检测效率的重要指标。YOLO目标检测算法因其在一个神经网络模型中同时实现对目标范围和目标类别的检测,所以具有检测速度快的优势,但存在检测准确率不高,对小目标的检测性能较差的问题。为此本文首先针对YOLO检测准确率不高的问题,提出了一种改进的R-YOLO模型。该模型将残差单元引入YOLO目标检测算法中,通过增加网络深度,不但提高了检测准确性,而且基于残差网络的快捷连接方式,可将前一层输出直接与后面的卷积层相连,虽然增加了一定的复杂度,但是不影响检测速度。其次,对改进模型中的三层卷积输出进行特征金字塔融合,将深层次的语义信息与浅层次的位置信息相结合,通过提升模型对小目标特征的学习能力,以提高小目标的检测准确度。实验结果表明,R-YOLO目标检测算法可以在保证检测速度的前提下,提高检测准确率,改善对小目标的检测性能。2、为突出实际应用中黑白图像的检测目标,提出了基于GAN的图像着色算法。该算法采用残差单元构成生成网络,在保证网络深度的同时,提高生成网络性能,改善着色效果。利用该算法在Pascal数据集上对不同分类的图像进行着色分析,并将其与R-YOLO模型进一步结合实现了目标着色处理。实验结果表明,运用优化后的GAN整体着色效果较好,对改进YOLO算法的目标检测结果进行着色处理,能够使目标检测结果清晰明确。3、利用Python语言,采用Py Qt技术,基于两种改进算法设计了目标检测与图像着色系统,该系统通过理论与应用相结合的方式,根据功能不同返回所需的可视化结果,验证了改进算法与系统的实用性。本文提出的基于残差网络与特征融合的改进YOLO目标检测算法、基于GAN网络的目标着色算法、以及基于改进算法所设计的目标检测与图像着色系统,具有一定的实用价值。
其他文献
钢渣是钢铁炼制过程中的产物,具有广泛的应用前景,本课题将钢渣应用于沥青路面面层中,分别对钢渣集料工程特性、钢渣吸附沥青特性、钢渣沥青混合料性能、钢渣工程应用进行研究。首先,通过钢渣物理特性研究,发现钢渣具有与沥青黏附性好、降温延迟的特性,对钢渣进行力学特性研究,发现钢渣拥有优秀的抗压碎和抗磨耗能力;对钢渣膨胀性研究发现,级配组成偏粗的钢渣膨胀量较小。其次,通过钢渣吸附性试验发现,随着沥青温度升高,
随着生物与医疗技术的发展,对生物分子的分离、捕获和聚集等提出了更高的要求,从而对介电泳操控技术的操控准确度要求越来越高,因此作为介电泳操控技术核心的介电泳频谱受到了广泛关注。但当前介电泳频谱的研究存在明显不足——因(?)|E|2在空间分布的不均匀及缺乏对速度获取过程中影响因素的分析,而导致所获取的介电泳速度不准确,进而导致获取的介电泳频谱不准确。为弥补传统方法的不足,提出了单自由度介电泳的频谱获取
桩基础是液化场地建筑物基础的主要应用形式,液化场地中群桩基础动力响应规律一直是建筑物抗震领域研究的热点。本文通过研究国内外文献,结合国内对群桩基础在液化场地中的横向动力响应特性以及桩土相互作用的研究进展,避开目前研究模型与现实工程群桩受力过程中应力应变关系差距较大的问题,展开原型应力应变关系条件下对液化场地中群桩基础横向动力响应及桩土相互作用问题的研究,主要内容包括:在不同峰值加速度正弦波和EL-
锂离子电池具有能量密度高、循环寿命长等优势,在手机、笔记本电脑、规模储能等领域得到了广泛的应用。为了满足日益增长的应用需求,人们对锂离子电池的能量密度、安全性能和循环寿命等方面提出了更高的要求。一方面,科研人员致力于开发新型高能量密度的电极材料,如富锂锰基正极材料(LMR)、镍钴锰三元正极材料、硅碳负极材料;另一方面,碳酸酯类电解液体系在高压或高温下容易分解,与新型电极材料的匹配效果不佳,严重影响
人体动作捕捉技术是在三维空间下复现目标人体的动作信息。目前所应用的人体动作捕捉技术有可穿戴标记式动作捕捉系统和机器视觉无标记动作捕捉系统,但是两种捕捉技术都存在自身难以克服的缺陷与不足。本文将结合Delsys IMU和Kinect传感器各自的优势,研发一种人体动作捕捉系统。该系统发挥两种传感器在人体动作捕捉技术上的优势,具有数据采集简单、准确度高、直观性强、对时间与地点要求低等优点。本课题研发的动
近年来,风电作为一种绿色能源受到世界各国的青睐,随着风电机组装机容量的增加,风电机组所暴露出的多种故障问题不容忽视,对于其中的叶片故障问题,如果不能及时发现、维修,不仅会降低风电机组的发电效率,还可能引发严重事故。本文针对风机叶片的故障诊断问题,主要研究内容如下:一、对基于声频信号和振动信号的故障诊断国内外研究现状进行总结分析,选取梅尔倒谱系数法(MFCC)和原型聚类作为本文研究风机叶片声音信号特
近年来,随着住宅不断产业化,钢管混凝土结构得到了广泛的应用。作为关键部位的梁柱节点连接形式较为复杂、施工容错性小,在一定程度上限制了该结构形式的发展。为推广钢管混凝土结构的应用,有必要研究一种装配方便、施工容错性大的节点形式。为此本文拟通过上焊下栓的方式进行钢管混凝土柱与工字型钢梁的连接,并进行上焊下栓节点的抗震试验和有限元分析,为该类型节点的结构设计提供充分的参考依据。本文提出一种带外肋环板的隔
近年来,不断发展的脑成像技术为理解大脑特定区域与其功能提供了很大的帮助。多模态脑影像分析方法利用不同脑影像数据提供的多种信息,能够帮助医生分析脑疾病的病变机理。目前多模态脑影像分析还面临一定的困难,如多模态脑影像数据样本量少,脑影像的特征维度高、数据异构等问题,找出与疾病相关的特征,提高脑疾病诊断的准确率是目前多模态脑影像数据分析的重点。现有的脑影像分析方法通常只利用一种脑影像数据,或者将多种脑影
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)的功率密度高且工作效率高,优点显著易于控制。因此在工业生产,新能源汽车等方面以及伺服控制系统等方向都大量使用,PMSM的控制已经成为众多学者的研究热点。目前PMSM控制系统已经比较成熟,然而在很多场合,控制系统需要对系统外可能存在的干扰、负载的变化以及电机本身参数的变化等具有适应修正能力。当电机在实际运行
随着互联网科技的迅猛发展,网民数量和上网时长日益增加,特别是“互联网+”战略的推进,互联网已日益成为公众日常工作、生活、学习不可或缺的平台和助手,深刻地改变着人们的生活方式、行为方式和价值观念,随之产生了蕴含着丰富信息的用户网络行为数据。分析网络用户行为可以深入挖掘用户的行为偏好和性格特征,不仅对社会学、安全领域等有着理论价值,而且对于网络信息、动态监控和威胁预警等应用具有实际意义。现阶段,针对网