基于回归方法的物体检测算法研究与改进

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a341104361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络的发展,以及硬件技术的进步和大数据时代的到来,物体检测技术不仅检测率得到大幅提升,而且检测速度也极大加快。这使得物体检测在一些要求实时检测的系统中得以实现。诸如面向车载系统的物体检测任务,通过车载摄像头捕捉当前行驶道路的图像信息,对图像中的汽车、行人和骑行者进行自动准确实时地检测,即识别与定位。传统的物体检测算法需要人工提取特征,导致了鲁棒性差、平均检测率低的问题,难以对多类别物体进行检测。基于滑动窗口和基于候选区域的物体检测算法需要后处理,存在检测速度达不到实时和内存需求大的问题。而基于回归方法的物体检测算法,检测速度快、内存需求小,可以对多类别物体进行检测。但是目前基于回归方法的物体检测算法检测率较低,尤其是小物体和被遮挡物体。为了解决上述问题,本文对基于回归方法的物体检测算法进行改进,在保证检测速度达到实时的前提下,提高检测率和召回率。SqueezeDet算法在KITTI数据集上具有最快的检测速度,同时也是基于回归方法中检测率最高的物体检测算法之一。本文在SqueezeDet算法基础上进行改进,以提升平均检测率。在网络结构上,提出了带有闸门机制的越层连接结构,在高层特征空间进行抽象表达的同时,利用浅层的细节特征提升了小物体和被遮挡物体的检测率;在损失函数方面,将包围框的宽和高归一化为相对变化,改善了基准方法中存在的大物体和小物体包围框损失优化不平衡的问题,同时为了提高分类准确性,还将错误分类的惩罚项加入到分类损失的计算中;在包围框过滤时,采用加权的非极大值抑制方法,以解决基准算法中存在的包围框冗余的问题。另外,基准方法的网络层数较少但池化操作较多,由于池化操作导致细节信息难以保留,小物体和被遮挡物体检测率低,因此提出了用扩张卷积替代池化操作,在不改变分辨率的前提下扩大了模型的感受野。实验结果表明,本文算法在KITTI数据集上的平均检测率为80.1%,召回率为81.6%,检测速度为0.032 s。与基准算法相比,平均检测率提升了3.4%,召回率提升了2.8%,检测速度提升了2.7 ms。本文还将程序移植到移动设备,验证了算法的可用性和实时性。
其他文献
荧光分子断层成像(FMT)根据边界探测到的漫射光分布,同时考虑到组织对光的散射和吸收作用,选取合适的重建方法重建出荧光目标在体内的三维分布和荧光浓度,从而对生物体的生理和
在科学研究和工程应用中都涉及对优化问题的求解,而随着工业发展朝着新型化、综合化、连续化的方向迈进,使得工业生产过程中所面对的优化问题具有多目标求解、强非线性、高变
随着软件规模的扩大和软件复杂度的不断升,软件配置故障已成为导致软件系统失效的主要原因之一。目前软件系统内的配置项约束及其相互之间关联关系的复杂性是导致软件配置故
在当今社会,伴随着社交网络、物联网、互联网等技术的普及,全球数据信息正以指数级的速度爆炸性增长。而数据的存储量也由TB、PB到EB、ZB甚至YB不断扩大。然而,在人们的生活
精密单点定位(Precise Point Positioning,PPP)是一种高精度的单点定位技术,自从1997年Zumbeger等人提出精密单点定位技术,国内外许多专家学者从模型以及算法等多方面进行了
在科学研究和工程领域中许多问题都是由多个相互冲突的目标组成,一般称这一类问题为多目标优化问题。基于种群的进化算法在单次运行中能得到一个近似的Pareto解集,因此多目标
近年来,幻构人脸技术作为图像超分辨率(Super-Resolution,SR)的分支,受到了人脸图像邻域研究学者的重点关注。幻构人脸技术通过挖掘低分辨率(Low-Resolution,LR)人脸图像中的
图像识别在自动驾驶、医疗诊断等许多领域有着广泛的应用,而图像分割的结果将会在很大程度上影响到图像识别的准确性和正确性。之前对于图像分割的研究主要集中在对灰度图像
传统的无线多媒体传感器网络(WMSN)节点仅配备一路摄像机,图像感知区域有限,无法在同一时间实现全向的观测。由多个WMSN节点组成的观测网络,又存在覆盖失衡、数据传输冗余等
集成电路(IC)工艺和设计方法的提高,在单个芯片上集成多个芯片实现更为复杂的功能成为可能,系统芯片(SOC)集成技术在这种背景下应运而生。SOC的实现是采用知识产权(IP)核复用