面向自动驾驶的语义分割和目标检测技术

来源 :电子科技大学 | 被引量 : 18次 | 上传用户:yng2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,人工智能开始引领各行各业的发展,计算机视觉作为人工智能最直接的应用领域,已成为当前的研究热点。与此同时,卷积神经网络的出现极大地推动了计算机视觉领域的发展。计算机视觉与神经网络相结合,其最为主要,也是最为热门的落地点便是在自动驾驶系统的车外环境感知。车外环境感知包括了各类不同的任务,主要包括了目标检测识别、行人骨架线识别、图像语义分割等。对于自动驾驶车外环境感知系统而言,理想状态是同时运行这些任务,得到多种类型的结构化数据。本文的研究工作围绕基于深度学习神经网络的车外环境感知技术展开,具体包括目标检测识别、行人骨架线识别、图像语义分割等,并对多网络的融合以及网络压缩进行了研究。针对目标检测识别中网络泛化性较差的问题,论文通过在原有网络的基础上引入动态残差网络结构,使得模型可以适应不同交通场景,从而优化最终的结果。在这一过程中,本文通过自行采集并标注数据,得到了相应的目标识别训练及测试样本。针对人体骨架线识别这一课题,论文采用基于RGB图像的人体骨架线估计方法,自下而上,首先检测图像中所有人关键点的位置;在得到检测结果之后,通过构建人体关键点亲和场对关键点检测结果进行连接,最终得到人体的全部骨架信息。在自动驾驶场景中,人体骨架线识别是行人行为预测以及交警手势识别的基础。针对在测试像素级语义分割过程中遇到的部分像素点分类错误的问题,通过观察具体测试案例,发现其分类错误的原因主要是由于模型未能有效获取区域性信息。针对这一原因,提出了多尺度池化拼接方法进行改善。该方法可以有效地提取不同像素面积的区域性信息,并将这些区域性信息与局部信息进行整合。同时,理论分析了不同池化算法的优劣及原因,并通过实际测试直观地体现了多尺度池化拼接方法在改善像素点分类错误问题方面的有效性。针对同时运行三个模型所可能导致的总模型体积大、运行算力要求高、多个模型单独运作难以保证数据输出的同步性等一系列问题,研究了Root-Branch结构的混合增强网络MixNet。其中,Root部分实现了共用前端网络提取低层语义信息,有效减小了总模型体积以及运行时的算力要求;Branch部分实现了针对不同任务提取对应的高层语义信息,保证了模型的效果。这可以较大程度的提升算法在实时运行时的帧率,这点对于自动驾驶汽车车外感知极为重要,同时也利于算法的工程化应用。
其他文献
平川区兴平小学于2009年开始筹建,2010年秋季开始招生,是平川区委、区政府为了有效解决城区小学大班额问题和部分进城务工人员子女入学难问题而新建的一所区属六年制完全小学
战略层面:新概念,新威慑2010年,世界总体防务开支依然吃紧,军队和主要军工企业仍有"勒紧裤带"的感受。同时世界地缘政治格局和力量对比继续演变,战争样式和军事能力破旧立新。这
这虽说是一件平凡的小事,可它将影响着我的一生。
2011年3月19日,法军战机拉开了空中打击利比亚的序幕。随后,法军"阵风"战斗机和"幻影"-2000战斗机又进行了三次空袭。同日,美军和英军军舰与潜艇向利比亚发射了上百枚"战斧"式巡航
如何吸引游客到访旅游?如何提高本地的旅游潜力?针对这一系列问题,选定中国大陆地区作为对象展开研究,整个实证研究从基础调研做起,利用所得数据进行ADF检验、因果关系检验、滞后
5月5日,第六届“勇士竞赛”国际特种兵比武在约旦阿卜杜拉国王特战训练中心落下帷幕,在来自中国、俄罗斯、美国、加拿大等18个国家的33支代表队中,中国“雪豹突击队”获得第一,成
报纸
每年的春天,我都会带着孩子们走进美丽的校园去上一节语文课。记得那天,蔚蓝的天空飘着朵朵活泼可爱的白云,绿树与红楼互相映衬着,美丽的校园在召唤着我们。我带着一群孩子出
培养学生学习兴趣改进外语教学手段张小林爱因斯坦说过:“兴趣是最好的老师”。我国古代教育家孔子早就提出并成功地在教学中运用了“乐学”理论。然而,在我们今天的外语教学中
“三跨”项目为六地师生提供了“知识研习群”(Knowledge Community,简称KC)的网络平台(www.globalkc.net),作为知识建构及交流协作工具。在解渎KC在“三跨”项目中的应用前,让我们先
文章通过分析长三角、环渤海、珠三角三大经济圈的科技资源集聚度,以1997~2011年三大地区中心城市科技资源集聚度和各省GDP增长率为变量,讨论中心地区科技资源集聚与当地经济