论文部分内容阅读
在人工智能与实体经济深度融合发展的趋势下,以语音识别、自然语言处理、图像识别为代表的诸多人工智能先进成果被广泛应用于传统汽车的升级改造,不断提升着汽车的智能化程度。作为汽车智能进程中的一个重要分支技术,深度学习驱动的图像识别在最近几年取得了长足进步。但由于车载计算资源有限,目前仅能以工控机的硬件平台对深度学习算法进行加载,而直接面向嵌入式硬件移植的深度学习算法研究较少。本研究以复杂不确定交通环境中的行人识别为对象,通过对多种卷积神经网络框架下的行人识别算法展开对比研究,提出一种对硬件资源消耗较少,适于嵌入式硬件移植的行人识别方法。本文的主要工作包括:(1)从两个方面研究行人区域提取算法:一是通过基于图像底层的特征信息、视觉注意模型等ROI提取方法,结合形态学操作剔除噪声、平滑图像边界,提取行人特征区域创建行人数据集;二是采用K-means聚类算法对图像进行目标对象区域初步筛选,结合卷积上采样的特征多尺度组合方法,获得更精确的行人特征区域。(2)设计搭建适用于行人识别的Fast RCNN卷积神经网路,该网络以AlexNet网络模型为原型,以Caffe学习框架为基础,通过改进,增加四层用于生成行人推荐区域的RPN网络,一层用于将每个感兴趣区域生成固定尺寸特征映射图的ROI池化层。网络训练完成后,通过测试发现,Fast RCNN卷积神经网路总体识别效果能够满足高精度要求,但占用计算资源较高。(3)针对Fast RCNN硬件资源占用较高的问题,设计一种占用计算资源较少的YOLO卷积神经网络。该网络主要以darknet53网络结构为基础,结合ResNet层结构,将网络的逐层训练变换为逐阶段训练,缓解网络训练过程中出现梯度消失或弥散的问题,通过卷积上采样,获得图像多尺度特征映射图,使用逻辑回归分类器实现行人识别二分类问题,并深入探索Dropout与DropConnect两种方法去除过网络拟合问题。实验结果表明,Fast RCNN卷积神经网路对行人识别的精度更高、漏检率更低,但该网络的时效性较差,计算成本较高;YOLO卷积神经网络对小尺寸行人识别精度较高,且实时性强,占用计算资源较少,更具实用价值。