运动过程中的前方动态障碍识别技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:nyy1001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
私家车数量上涨导致交通事故量增加是现今社会面临的一个难题,研究汽车在驾驶场景下如何检测和规避前方障碍物、提升驾驶的安全性则是解决这个问题的关键,本文研究以运动中动态障碍识别技术为基础的防碰撞预警系统。预警系统的实现除了依靠科学合理的预警模型,还依赖检测算法的实时性和准确性。但目前的目标检测算法大多检测速度过慢,难以在车载设备上达到实时检测的要求,而能满足实时性的改进算法又普遍精度过低。故针对以上问题,本文在提升算法检测速度和精度方面依次进行了创新,设计了一种新的预警模型。主要工作如下:1.算法方面,本文以YOLO v4为基础进行改进。针对检测速度慢的问题,本文利用Mobile Net v1的深度可分离卷积和宽度因子修改原主干特征提取网络。针对轻量化改进导致检测精度下降以及算法本身小目标检测效果不佳的问题,首先修改检测层,删除13×13的检测层、增加104×104的检测层,然后利用改进后的聚类算法K-Means++获取新的初始候选框。实验结果表明,改进后算法平均精度均值(m AP)为90.32%,每秒可处理的图像帧数(FPS)最高可达35帧。在精度仅损失2%的情况下,速度提升为原算法的1.66倍,充分证明了改进算法的有效性。2.预警模型方面,根据障碍物不同的运动特性提出一种新的预警模型。针对速度较慢、行动轨迹不可预测的行人和电动车等,实现相对距离的检测,并依据距离进行预警。针对移动速度较快的汽车和公交车,在实现相对距离检测的基础上进一步实现相对速度检测,计算碰撞发生的可能性以及时间,并依据碰撞时间进行预警。分类预警模型充分考虑了驾驶场景中不同障碍物的实际运动特点,是一种可靠的预警模型。
其他文献
近年来,以BERT(Bidirectional Encoder Representations from Transformers)为代表的预训练语言模型在口语理解任务中有着优异的性能表现。然而,这类语言模型虽然性能较为出色,却通常只能在文本层面建立上下文关联,而缺少丰富的外部知识来支持其完成更为复杂的推理。为了解决这一问题,进一步提升此类语言模型在口语理解任务中的性能表现,本文提出:(1)为BE
学位
在“双碳“背景下,电动汽车因零排放,噪声小,能耗低等优点,将迎来较大的发展机遇。然而,电动汽车的快速发展暴露了充电桩等基础设施落后、车桩比悬殊的问题。私桩的加入可以改善上述问题,但也带来了服务质量良莠不齐,计价不合理,用户体验不佳的挑战。目前,常用可信度计算的方法来解决上述挑战,用于可信度计算的数据主要存储在第三方或者区块链充电平台。基于第三方的信誉方案存在中心欺骗,单点故障的问题;基于区块链的信
学位
随着物联网技术的飞速发展,各种物联网设备采集的数据源源不断产生并大量积累,这些数据具有巨大的利用价值并产生了大量的业务应用需求,此类应用也成为了众多行业领域的热点。在这些领域的应用建设中,围绕这些物联网数据的很多应用往往可以被表示为物联网分布计算环境下由一组大数据处理与分析任务构成的工作流,本文中把这种工作流称为数据密集型工作流。与传统工作流不同的是,物联网环境下这种数据密集型工作流具有数据来源分
学位
人群计数是人群监测和人群分析的核心技术,对于公共安全管理、科学部署安保措施有重要意义。近年来,随着深度学习技术的发展,涌现出大量基于密度估计的深度神经网络用于人群计数工作,而这些网络在计数精度或检测速度上缺难以达到实际应用的需求。为了提升人群计数网络的计数精度和检测速度,本文设计并搭建了基于多尺度感知网络的密集人群计数算法,通过设计多尺度聚合模块解决了人群计数中普遍存在的人头尺度问题,引入空洞卷积
学位
近年来,机器学习(Machine Learning,ML)和自动化语音识别(Automated Speech Recognition,ASR)技术日渐成熟。语音输入替代文字键盘输入成为可能。然而,在一些专业技术领域,由于多采用专业技术术语,给语音输入提出巨大挑战。一个最主要的问题是带有标签的专业语音数据量较少,无法满足自动语音识别系统训练的数据量需求,进而导致语音识别模型过拟合,语音识别准确度不高
学位
异构网络是具有多种类型顶点(对象)和边(链接)的有向图,其不但能够表达丰富的结构和语义信息而且可以更加自然地抽象现实世界。凝聚子图发现作为图挖掘中的一个基础且重要的问题在异构网络中同样有较高的研究价值,并已成为该领域研究的重点和热点问题,也在社区发现、故障检测和生物研究等方面有着重要应用。为此,本文深入研究了两种不同异构网络中的凝聚子图发现问题并给出了对应的算法设计以及具体的应用案例。第一,研究了
学位
自然语言处理的研究目标是实现对自然语言的理解,这种“理解”被应用到很多领域,如:问答任务,阅读理解任务,文本摘要任务等,其中文本摘要任务指基于对源文本的“理解”得到精简摘要,在读者阅读大量文本内容时,这项任务能帮助读者减少阅读量,提高阅读效率,因此对文本摘要任务的研究具有十分重要的意义。的方式主要有抽取式和生成式,抽取式指抽取文本重要内容拼接成摘要,但如果对文本特征提取的不全面会丢失关键信息,生成
学位
近年来,依托于深度学习等人工智能技术的革新,人脸绘制技术逐渐成为专家学者们的研究热点,在刑事侦查、数字媒体、教育培训、影视娱乐等领域中应用广泛。基于面部特征的人脸绘制技术,是通过深度学习获得真实人脸图像与面部特征的对应关系,根据用户绘制的面部轮廓特征,实时生成二维图像,逐步逼近真实世界中的人脸。但目前的人脸绘制技术依赖于大量的人脸特征数据集,生成的人脸结果存在可控性差、细节不够清晰等问题,因此,本
学位
机器阅读理解要求计算机根据给定的文本回答问题,是一项能衡量机器对人类语言理解程度的任务。随着深度学习技术的发展,机器阅读理解相关研究取得重大进展。尤其是在英文领域,近些年发布了多个大规模高质量数据集,使得很多基于深度学习的经典模型在英文机器阅读理解任务上表现得非常出色。然而中文领域的研究起步较晚,进展相对缓慢。由于语言特点的差异,一些在英文数据集上表现出色的经典模型在处理中文文本时不能达到同样的效
学位
物联网(Io T)设备和流媒体平台的兴起使动态数据或流数据爆发式增长,基于数据进行准确高效地预测在能源、医疗、金融等领域具有广泛的应用。随着物联网技术的发展,工厂中引入了大量的传感器,其采集到的运行数据能够直接反映设备的状态。充分挖掘传感数据中的信息提前预警,对保障工厂的平稳运行具有重大意义。本文基于火电厂传感数据,深入研究了数据分布发生变化情况下的多变量时间序列预测问题。为了提高时间序列预测的精
学位