论文部分内容阅读
随着社会经济的不断发展,交通基础设施建设和道路状况无法满足当前社会交通需求,交通安全问题和交通拥堵问题已然成为进一步提升社会生产活动效率的绊脚石。无人驾驶汽车具有比人类更加广阔的环境感知能力和得天独厚的路径规划能力,能够大幅度降低交通事故率,缓解交通拥堵压力。由此可见,大力发展无人驾驶汽车对于缓解乃至解决交通安全和交通拥堵等问题具有巨大的实际意义。无人驾驶的场景识别是指利用车载摄像头记录的车辆周围视觉环境数据,识别当前无人车所处的交通场景和环境信息,属于无人驾驶汽车感知层的一项重要任务。由于无人驾驶系统依赖环境感知结果进行驾驶行为决策,场景识别的输出结果会对无人驾驶汽车的驾驶行为产生深刻和巨大的影响。针对无人驾驶场景识别的研究具有重大的现实意义。近几年随着深度学习的迅速发展,基于深度学习的解决方案被广泛应用在各种科学领域并且取得了良好的效果。尤其是卷积神经网络的提出,具有局部连接和权值共享的特点,不仅降低了网络模型复杂度还减小了权值参数数量,因此特别适用于诸如图像场景识别这样输入数据体量庞大、信息丰富的任务。对于深度学习而言,同时具备密集性和差异性的数据集是取得良好场景识别效果的关键因素。但是目前尚未出现针对无人驾驶场景识别的大体量数据库,这严重制约了深度学习在无人驾驶场景识别领域的推广和发展。本文基于无人驾驶典型场景类别,建设了世界范围内首个针对无人驾驶场景识别的大规模数据集SYSU-DrivingScene(SYSU-DS)。数据集包含282700张已标记的无人驾驶场景图片,场景类别子集4个,场景类别57种,场景标签总量突破95万。SYSU-DS是目前世界上规模最大、场景种类最齐全的无人驾驶场景识别数据集,为无人驾驶场景识别工作提供了坚实的数据基础。本文通过在SYSU-DS数据集上测试并发布多种先进的深度学习分类模型,验证了该数据集存在合理的偏差现象,具备一定的泛化能力。既具备针对无人驾驶场景识别的专业性,能够客观真实地反映真实场景信息,又能够使基于其他数据集训练的模型取得合理的场景识别准确率。本文提出了具有场景相似度感知能力的无人驾驶场景识别网络结构SceneNet。由于无人驾驶中不同类别场景之间具有相似性,并且同类别场景内部具有差异性,这给提升无人驾驶场景识别准确率带来了极大困难。通过与其他先进的场景识别网络进行对比实验,SceneNet获得了比其他场景识别网络更优的无人驾驶场景识别结果,验证SceneNet能够在一定程度上解决上述无人驾驶场景识别难题。本文通过在SYSU-DS数据集上进行多类别标签实验和以场景为中心的图片检索实验,结果显示数个先进的多类别标签模型和图片检索模型取得了合理的实验结果。验证了SYSU-DS数据集具备适用于多类别标签和图片检索等研究课题的可行性,证明其具有较大的学术价值与潜力。