【摘 要】
:
随着科学技术的进步,人工智能技术得到人们越来越广泛的关注,在研究人工智能的过程中,出现了很多杰出的科研成果,深度神经网络就是其中之一。深度神经网络优秀的特征提取性能使得众多研究者尝试将它融入到传统的图像处理算法中,并使得计算机视觉技术得到了长足的发展。由此,计算机视觉技术的应用范围越来越广,智能汽车就是一个重要的应用方向。针对当前智能汽车的行人目标视觉感知性能较低的问题,提出了一种基于深度学习的融
论文部分内容阅读
随着科学技术的进步,人工智能技术得到人们越来越广泛的关注,在研究人工智能的过程中,出现了很多杰出的科研成果,深度神经网络就是其中之一。深度神经网络优秀的特征提取性能使得众多研究者尝试将它融入到传统的图像处理算法中,并使得计算机视觉技术得到了长足的发展。由此,计算机视觉技术的应用范围越来越广,智能汽车就是一个重要的应用方向。针对当前智能汽车的行人目标视觉感知性能较低的问题,提出了一种基于深度学习的融合了Mask R-CNN算法与Deep SORT算法的行人跟踪与姿态估计模型,论文的主要内容如下:(1)针对Mask R-CNN区域建议网络中所使用的锚框在训练行人目标特征时收敛速度较慢这一问题,提出如下解决方案:根据统计学规律,使用更符合行人目标自然宽高比的锚框替换部分原锚框。具体做法是去除宽高比为2:1的锚框,替换成宽高比为2:5的锚框,对于新的锚框组,锚框数量与面积相对于原锚框组保持不变,只改变锚框的尺度。使用这种优化方式,可以在不引入额外计算量的前提下加快网络的收敛速度,提高检测的精度与速度。(2)针对Mask R-CNN深度残差网络中使用直连通道连接输入层与后面的层,卷积核类型不够全面这一问题,提出如下解决方案:移植了轻量级网络模块SKNet替换部分原网络的卷积模块。具体做法是用3×3的卷积与5×5的卷积加上一个特征通道权重全连接层组成SKNet网络结构,使用这个新的网络结构替换原卷积层中核为3×3的卷积模块。使用这种优化方式,可以使网络在训练过程中能自适应地选取最佳的卷积核,提高特征表示的质量,提高检测的精度与速度。(3)针对Deep SORT特征匹配过程中使用传统的卷积神经网络特征作为目标的特征描述算子,在对行人目标进行特征表达时效果不理想这一问题,提出如下解决方案:用在图像局部区域内的方格单元上进行统计计算的方向梯度直方图作为特征描述算子。使用这种优化方式,可以加强提取行人目标过程中的抗干扰能力,提高特征匹配时的精确度与鲁棒性。论文通过对比实验验证了各个关键模块对模型性能的提升效果,将模型与另外几种主流算法进行了对比,比较了对行人目标的输出框与标注框的中心点平均误差距离,通过实验数据说明了论文对模型的优化具有实际意义。
其他文献
图像语义分割的定义是为图像中的每一个像素分配一个预先定义好的表示其语义类别的标签。图像语义分割在自动驾驶、医学图像识别、卫星遥感信息系统等领域有着广泛的应用。由于图像语义分割在对图像进行分割时应用到了语义信息,成为了目前图像分割的重要研究方向。深度学习方法由于其自主学习能力强被广泛应用,将深度学习方法应用于图像语义分割是图像处理领域的热点研究方向之一,具有理论研究价值和实际应用前景。针对图像语义分
由于信息技术和互联网的迅猛发展,网络信息安全问题也随之增多。人们通过互联网获取信息的过程中,图像信息大约占比75%。图像中所包含的信息相当一部分涉及隐私,如果信息泄露,会产生不可估量的后果。本文结合混沌理论和小波理论等相关技术,以提高图像加密的安全性为目标,开展图像加密算法研究,取得了如下的研究成果:(1)针对现有图像加密算法安全性低,抗攻击能力差的问题,提出一种基于混沌和小波理论的图像加密算法。
再生混凝土(recycle aggregates concrete,RAC)的应用为循环利用废弃资源、减弱环境污染提供了新的途径,有着显著的经济和社会效益。但由于再生骨料相对天然骨料具有孔隙率大、吸水率高、压碎性指标高等特点,使得RAC各方面性能与普通混凝土相比具有一定的差异,在低温环境下这些差异更加明显。现有研究表明,将一定掺量的纤维和纳米材料掺入RAC,可以有效抑制裂缝发展,提升RAC的密实度
随着现代制造业的发展,数控机床的定位精度越来越受到人们的重视。滚珠丝杠副是数控机床的重要部件,该部件摩擦力的大小对数控机床的性能影响很大。本文以某型滚珠丝杠副为研究对象,提出了利用超声振动减小滚珠丝杠副的摩擦力的减摩方法。本文从理论与实验两方面,对滚珠丝杠副的超声振动减摩进行了探究。在理论方面,利用赫兹接触理论和坐标变换理论,对滚珠丝杠副进行了运动学分析,建立了滚珠丝杠副动态接触模型,确定了滚珠与
图像隐写是信息安全领域中一种隐藏信息的技术,为以数字图像为载体的秘密信息在互联网中的安全传递提供了保障。基于修改式的图像隐写在面对日益强大的隐写分析时,难以抵抗其检测。无载体图像隐写通过不修改原始数字图像载体的方式将信息隐藏到载体中,有效的提高了图像隐写的安全性。深度学习的出现为无载体图像隐写提供了一种新的思路。基于深度学习的无载体图像隐写的研究价值较高且应用的前景较为广阔。对基于深度学习的无载体
混杂砖骨料再生混凝土是利用拆除已有建筑物产生的废弃混凝土和砖粉碎后筛选获得的混杂粗骨料颗粒替代普通混凝土中的天然粗骨料制备而成的新型混凝土,这种混凝土具有自重轻和抗震性好的特点,并且能够对建筑垃圾进行回收再利用,减少大规模开山凿石带来的环境污染问题,以达到节约资源保护环境的目的。压型钢板是将具有一定厚度的钢板通过轧制成具有一定截面形状的金属板,这种金属板在土木工程施工过程中能够代替楼板底模,省去了
作为汽车组成部件最重要的系统之一,汽车转向系统是驾驶员针对路况信息变化时用来调整或恢复原始行车方向的装置,是联系人、车、路之间的桥梁。随着科学技术水平的大幅提高和汽车行业越来越激烈的竞争,电动助力转向系统以其结构简单、节能环保、按需提供助力等一系列优点开始成为市场主流。电动助力转向系统的好坏直接关系到汽车转向的轻便性和稳定性,为了缓解驾驶员的操纵手力,提高汽车的转向性能,本文提出了一种新的鲁棒控制
造纸生产过程中的打浆、配浆过程尤其重要。通过控制打浆过程,使得生产出的纸浆适应造纸机生产的需要,改善纸页的强度和均匀度,使成浆质量更稳定。通过控制配浆过程,在纸浆中按一定比例配入草浆或其他添加料,不但能节约原浆料,而且还能保持纸浆的原有特性,生产出高级用纸,满足当今社会生产需求。以造纸打浆过程为研究对象,给出基于模糊逻辑的造纸打浆的集散控制方案。在调查和研究打浆过程及其控制的基础上,建立打浆过程的
随着移动智能设备和位置服务的广泛应用,基于位置的社交网络(Location-Based Social Network,LBSN)已经逐渐深入到每个人的生活当中,针对用户进行个性化的兴趣点(Point-Of-Interest,POI)推荐研究也就变得越来越重要。通过学习用户-POI的实际交互为用户提供合适的POI推荐服务,不仅能够帮助用户快速找到喜欢的POI,还可以帮助商家发现更多潜在客户以提高经济
汽车产业的快速发展在给人们生活带来便利的同时也带来了许多的交通安全问题,研究无人驾驶技术既符合当下智能时代的发展趋势,也是帮助解决道路交通安全问题的重要手段。对于无人驾驶车辆而言,环境感知和路径规划是非常重要的两个方面,其在保证车辆行驶安全方面起到了不可或缺的作用。中国汽车工程学会举办的大学生无人驾驶方程式大赛为高校在校生研究无人驾驶技术提供了广泛且专业的平台。论文依托于国家自然基金项目(5167