基于改进深度强化学习的自动泊车路径规划

来源 :重庆理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:a610735932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于深度强化学习的运动规划方法,以车辆位姿、方向盘转角和与障碍物的最小距离作为状态,以目标方向盘转角作为动作,通过Pytorch搭建了基于深度强化学习的泊车算法框架。设计基于引导的奖励函数以避免奖励稀疏问题;以回合平均奖励作为优先级,将经验池改进为基于优先队列对样本进行存储和淘汰;针对泊车问题,提出了基于课程学习的分阶段训练方法,加速算法收敛。仿真结果表明:提出的算法较原始算法收敛速度提高25%,完成训练的智能体具有较强的规划能力和健壮性,规划成功率达到90.6%,同时具有良好的舒适性和安全性。
其他文献
传统聚氨酯增韧环氧树脂以有机溶剂为基础,由于其挥发性有机物含量高,在生产安全性和环境保护等方面存在较多问题,其应用正逐步受到限制。目前国内外对水性体系中环氧树脂增韧技术的研究及成果较少,水性环氧树脂仍存在脆性较大、耐水性及耐候性不足等问题,因此研究水性聚氨酯增韧环氧树脂具有重要的工程意义和广阔的应用前景。本文在分析溶剂型环氧树脂增韧方法的基础上,综述了国内外水性聚氨酯增韧环氧树脂的制备原理及应用进展,并讨论了聚氨酯增韧环氧树脂乳液制备技术的设计思路,分析了聚氨酯柔性纳米粒子与无机刚性纳米粒子协同增韧水性环
癌症、心脑血管疾病、中枢神经疾病已成为威胁人类健康的三大杀手。传统的小分子药物在治疗过程中由于存在特异性差等缺点,很容易对除病灶细胞以外的正常细胞造成影响,从而对机体产生毒副作用。蛋白质作为药物相较于传统小分子药物而言具有更高的生物相容性和特异性。然而,特殊的分子结构和生化性质使得蛋白质药物很容易在复杂的生物环境中因受影响而失活,从而限制了蛋白质药物在生物医学上的应用。因此,寻找理想的药物递送系统来弥补药物自身不足,帮助药物在病灶区顺利发挥作用显得尤为重要。为了解决这一问题,业内开发了各种具有不同功能的纳
尾矿制备辅助胶凝材料是实现尾矿大规模资源化利用的重要途径。本工作研究了机械-化学活化对钨尾矿颗粒粒径和比表面积的影响,探究了不同活化方式、活化剂种类对钨尾矿制备胶砂试块机械强度的影响,通过XRD、SEM、IR对水化产物的物相及微观结构进行表征。结果表明,机械-化学活化能有效降低颗粒平均粒径并增加胶砂试块的活性指数,活化效果最佳的是三元复合活化剂,其次是二元复合活化剂,效果较弱的是单一活化剂。采用H1、C1和G1三元复合活化剂活化钨尾矿后,直径小于10μm的钨尾矿颗粒达到了70.07%,制备的胶砂试块活性指
摘 要:随着各企业数据完整性意识的提高及实验室计算机系统化的更新,近年来,制药行业实验室数据可靠性问题有所减少,但仍是监管机构检查的重中之重。在现在的法规要求和监管环境下,实验室如何持续动态地提升管理水平来满足法规要求依然是企业关注的重点。本文结合监管机构在实验室检查中发现的典型数据可靠性缺陷,梳理日常工作中容易发生的数据可靠性问题,对这些问题进行分析,并提出相应的解决方案和措施。  关键词:实验
在长骨大段骨缺损修复中,自体骨移植是治疗的“金标准”,但存在来源有限等问题;合金和部分陶瓷由于应力屏蔽效应而引起骨吸收;可降解生物材料的力学性能无法与皮质骨相匹配。因此,力学适配性是目前硬组织修复材料研究的首要目标。通过汇总硬组织修复材料的拉伸强度-杨氏模量的关系、断裂韧度-杨氏模量的关系、冲击强度(韧度)-杨氏模量的关系和杨氏模量-密度的关系可以发现,现有硬组织修复材料的四对力学性质都没有进入皮质骨的范围,离长骨骨干力学性质中央区域还有很长的距离。骨的微观结构对开发新型骨修复材料极具启示。骨实际上是一种
随着建筑行业的迅速发展,钢筋混凝土结构得到了广泛应用。但钢筋混凝土结构长期处在氯盐环境中易发生钢筋腐蚀现象,从而降低结构的耐久性。因此,全面系统地认识混凝土内氯离子扩散的影响有助于解决结构氯盐侵蚀问题。氯离子在混凝土中的传输机制极其复杂,其中扩散是氯离子传输的主要机制。文章梳理了国内外近年来关于混凝土内氯离子扩散的研究进展,重点评述了混凝土内氯离子扩散的影响因素,笔者认为低水灰比、加入掺和料、适当增加保护层厚度、限制裂缝宽度等基本措施可以有效减缓钢筋腐蚀。若结构处于恶劣环境中,在采取基本措施的基础上,还需
提出了一种基于随机森林的N1+N2结构语法关系分类判定方法,在自建熟语料库的基础上,为每个短语结构建立用于分类决策树的7个特征,使用C4.5方法生成决策树,构造随机森林算法,通过投票原则给出最终判断结果。经训练集学习后,在含有1 020条语料的测试集中进行测试,正确率达到94.8%。结果表明:使用随机森林算法进行汉语短语结构语法关系分类判定是行之有效的。
针对无人车辆轨迹跟踪问题,为兼顾车辆轨迹跟踪和横摆稳定的双控制目标,提出了一种无人车辆轨迹跟踪与横摆稳定协调控制策略。根据车辆轨迹跟踪模型,基于快速幂次趋近律设计了车辆轨迹跟踪滑模控制器,旨在通过无人车辆自主转向控制跟踪参考轨迹。同时,利用滑模算法设计了车辆横摆稳定控制器,通过横摆力矩控制跟踪参考横摆角速度。考虑到横摆稳定控制器中横向车速未知的情况,设计了横向车速滑模观测器,从而为横摆稳定控制器提供信息输入。此外,利用横摆力矩控制量设计了前轮转向角补偿模块,通过轨迹跟踪和横摆稳定控制器的协调,进一步修正轨
为了提高车辆主动避撞系统的安全性和舒适性,建立了纵向和横向危险状态判别模型以判断车辆行驶时的安全性,设计了基于模糊控制的车辆主动避撞系统,模糊控制器Ⅰ选取驾驶员类
纳米颗粒稳定乳状液具有高稳定性和高黏度等独特性质,因而在提高采收率领域比传统表面活性剂稳定乳状液体系更具应用潜力。通过调研近年来国内外文献,概述了纳米颗粒稳定乳状液的作用机理,包括空间位阻稳定机理和颗粒架桥稳定机理;总结了纳米颗粒稳定乳状液的主要影响因素,包括纳米颗粒的性质如润湿性、粒径、浓度和形状各向异性,水相的性质如pH值和矿化度,以及油相的性质;详细阐述了纳米颗粒稳定乳状液在提高原油采收率领域的最新研究进展,分析表明纳米颗粒不仅大幅度提高了乳状液的稳定性,而且增强了乳状液的流度控制能力,另外还能与表