论文部分内容阅读
人工智能和计算机视觉的发展使得智能交通系统成为研究热点。作为交通环境中的主要物体,交通标志的检测与识别和行人的检测在驾驶辅助和自动驾驶系统中显得至关重要。由于应用场景的限制,对于交通标志检测与识别而言,实时性同检测率和识别率一样,都是非常重要的评价指标。另外,作为大多数交通标志检测方法的第一步,目前的颜色预处理方法对光照变化、复杂背景、成像条件等,具有较差的鲁棒性。与交通标志相比,行人具有更大的类内变化,主要表现于着装、走路姿态、肤色等方面,使得行人更难检测。本文从下述三个方面对交通标志检测与识别和行人检测进行了系统性的研究:(1)交通标志颜色预处理方法对光照变化、复杂背景、成像条件等的鲁棒性问题;(2)交通标志检测与识别方法的实时性问题;(3)探索先验信息对行人检测的特征设计所起的作用,以捕捉行人的特定属性。论文主要贡献如下: (1)针对交通标志颜色预处理方法对光照变化、复杂背景、成像条件等不鲁棒的问题,提出了一种基于交通标志主颜色的概率分布模型。该模型基于实际交通环境中采集的交通标志的主颜色样本,将颜色预处理问题转化为概率问题。其核心思想是计算输入图像中每个像素属于交通标志主颜色的概率,并以该概率值作为亮度值生成相应的颜色概率图,从而增强了交通标志主颜色区域的亮度和对比度,使得交通标志更容易被检测。实验结果表明,该模型对于光照变化、复杂背景、成像条件、小尺度以及褪色等都有较好的鲁棒性,并且通过预先计算的概率查找表使得该模型有很好的实时性。与其他颜色预处理方法相比,该模型具有较好的背景处理能力,更易于检测出城市街区中的交通标志。 (2)针对交通标志检测的实时性问题,提出了一种实时交通标志检测框架。该框架包含粗提和细验两个阶段,粗提阶段采用MSER区域检测子从输入图像的颜色概率图中提取交通标志候选区域,目的是采用简单的方法快速找出输入图像中所有可能的交通标志候选区域,以减小后续方法的搜索空间;细验阶段则采用“积分通道特征+ AdaBoost”和“颜色HOG+ SVM”两种较为复杂的方法对这些候选区域进行确认,以完成最后的检测任务。实验结果表明,该框架不仅有较高的检测率,且具有很好的实时性,在GTSDB数据集上比目前检测率最高的方法快20倍。 (3)针对交通标志识别的实时性问题,设计了一种简单结构的卷积神经网络。该网络包含两个卷积层、两个子采样层和两个全连接层。网络采用单通道灰度图像作为输入,避免了显式的特征提取过程。在该网络中,卷积层相当于特征提取层,通过将输入图像与多个滤波器进行卷积运算,增强输入图像中的有用信息,并降低噪声。子采样层相当于特征映射层,对滤波后的图像进行二次特征提取,提高对微小变化的不变性。全连接层则相当于分类器,采用子采样层的输出作为特征,进行最后的分类。实验结果表明,该网络不仅具有较高的识别率,且实时性非常好,处理一幅图像只需3毫秒(333帧/每秒)。 (4)针对交通环境中的行人检测问题,提出了一种基于先验信息的行人检测方法。该方法的核心思想是基于行人的对称先验和跨通道先验信息设计了两种矩形特征,即对称特征和跨通道特征,用于捕捉行人所包含的一些特定信息,从而为一些通用的特征(比如haar矩形特征)提供补充信息,提升行人检测的性能。实验结果表明,这两种特征是行人检测的两种重要特征,它们能为行人检测提供十分有用的信息,在Caltech数据集上取得了领先的检测结果。特别地,在该数据集的“尺度”和“遮挡”两个子集上的实验表明,这两种特征对于不同尺度和不同遮挡程度都具有较好的鲁棒性;在“尺度=medium”子集上的实验表明,本方法更适用于真实交通环境中的行人检测。 (5)针对中国交通标志检测领域缺乏统一的公开数据库的问题,建立并发布了一个中国交通标志检测数据库。该数据库中的图像拍摄于北京以及厦门的真实交通环境,所有图像均采用车载摄像机拍摄,以车辆的视角进行记录。该数据库共覆盖了48种子类的交通标志,其中禁令标志23种、指示标志10种、警告标志15种。图像总数为1,100幅,其中训练图像700幅、测试图像400幅。该数据库的发布填补了中国交通标志检测领域缺乏统一数据库的缺口,促进了中国交通标志检测的研究与发展。