论文部分内容阅读
目标检测是计算机视觉任务中的一个重要研究领域,现已在安防、医学和军事等诸多场景中得到应用。随着城市智能、工业智能、医学智能等迅速发展,对目标检测的速度和精度提出了迫切且严格的要求。近年来,深度学习凭借其强大的自主特征学习能力在目标检测任务上的检测精度不断提升。但是,传统的可见光单模态图像的目标检测,限制了复杂场景下目标检测的应用。同时,信息技术的迅猛发展使得数据表示形式也呈现出多态性、多源性和多描述性的特点。可见光、红外、激光等多波段数据可以实现数据互补,不同波段的图像或信号提供的信息具有冗余性、互补性和合作性。多波段目标检测大大扩展了深度学习应用场景,具有重要的研究价值。本文从工程应用和算法研究出发,针对短波段一维医学信号、可见光波段二维人脸图像、红外波段城市场景图像,分别提出了三种改进型深度学习算法,建立了多波段目标检测系统,并实现了实际场景应用。本文主要研究工作如下:(1)提出基于改进型卷积神经网络的短波段脑电信号目标检测算法,实现了注意力缺陷障碍(Attention Deficit Hyperactivity Disorder,ADHD)患者脑部量化自动诊断。由于脑部病变的复杂性和不可预见性,导致目前临床上仍有部分脑部疾病无法实现定量诊断,为进一步诊疗带来很大的障碍。本文针对注意力缺陷障碍患者只能定性诊断这一局限性,采集了一批对照组和患者临床脑电数据,通过提出改进型深度学习算法,检测一维病变信号。实验表明,本文对短波段的脑电信号图的检测可以有效检测注意力缺陷障碍患者,诊断率高,量化性好,能高效的辅助临床脑部疾病的诊断。(2)提出基于多级联卷积神经网络(Multi-task Convolutional Neural Network,MTCNN)的可见光波段目标检测算法,应用于人脸检测算法,实现了可应用于身份认证与安全防护的软件识别系统。人脸检测是可见光波段图像中最常见且应用范围最广的。本文通过提出级联型卷积神经网络并结合FaceNet,充分提取可见光波段二维图像的特征,实现了一种新的人脸检测网络。实验表明,该方法检测率高,误检率低。本文基于该算法搭建了一套人脸检测识别软件系统,已应用于多种身份验证实际场景,能满足实时人脸检测要求。同时本文还对人脸表情识别进行了研究,所设计的VGG模型完成了对人脸表情图片的检测、特征点提取以及人脸表情的分类。本文结合深度学习算法,在可见光波段的人脸检测基础上,完成了一系列的人脸属性识别研究任务,具有很高的实际应用价值。(3)提出基于改进型YOLO(You Only Look Once,YOLO)算法的红外波段目标检测算法,应用于行人车辆检测,实现了可应用于辅助驾驶及无人系统的红外目标实时检测。红外成像中目标的亮度几乎不受光源和纹理的影响,是夜视、可见光不足等情况下必要的图像获取方法。本文提出了一种改进型YOLOv3-Infrared算法。首先,利用风格转换网络将红外图像转换成伪可见光图像,从而提升图像质量;然后,对红外目标进行维度聚类;再次,调整网络预训练过程和多尺度训练模型。最后,引入浅层特征图语义增强分支,增强对低分辨率像素的检测效果,实现红外目标检测。将本文提出的红外目标检测方法应用于行人和车辆检测。实验表明,本文提出的方法明显优于YOLOv3,且实时性好,准确率高,漏检率低。可应用于辅助驾驶及无人系统中,提高驾驶员和行人夜间出行的安全性。综上所述,本文针对多波段一维和二维信号,提出了三种改进型深度学习目标检测方法,实现了软件系统的实际应用,可应用于辅助医学诊疗、辅助自动驾驶、安防监控、无人系统等,完成了目标检测一系列理论研究和工程应用。