【摘 要】
:
针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为了降低过拟合的概率,因此神经网络选择较优的动作,提出以多层感知机为基础的深度Q网络算法(Deep Q-learning Network, DQN)。为了得到动态的奖励值,该算法根据目标的相关信息改进奖励函数,根据动态的奖励值来区别不同动作的价值,从而提升神经网络动作选择的效率
【基金项目】
:
国家自然科学基金项目(62172351);
论文部分内容阅读
针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为了降低过拟合的概率,因此神经网络选择较优的动作,提出以多层感知机为基础的深度Q网络算法(Deep Q-learning Network, DQN)。为了得到动态的奖励值,该算法根据目标的相关信息改进奖励函数,根据动态的奖励值来区别不同动作的价值,从而提升神经网络动作选择的效率。实验结果表明,该算法能够用更少的探索步数使奖励值趋向平稳,并且找到较优路径。
其他文献
随着国家对教育事业越来越重视,对教育经费的投入加大,中小学如何管理好教育经费也越来越重要。然而,违法违纪,以权谋私的现象仍然存在,影响了教育事业的健康持续发展。目前,反腐倡廉是党和全社会重点关注的问题,而建立健全内部控制体系对于规范权利行使、预防舞弊和腐败具有重要作用。但中小学内部控制仍存在一些问题,本文对中小学内部控制的现状进行分析,并从内控制度、执行、监督及队伍建设四方面提出建议。
为探讨煤层纳米级孔隙结构对瓦斯运移特性影响机理,选取霍尔辛赫煤矿3号煤层煤样进行小角X射线散射试验,得出该煤层煤体纳米范围内孔隙结构参数及分布特征。基于试验所取得参数,并结合实际地温和储层压力条件进行数值模拟,引入运移通道可达性系数和运移时间定量表征瓦斯输运效率。结果表明:煤样纳米孔隙中瓦斯的主要运移方式为过渡流。孔隙通道内各初始条件对瓦斯运移特性影响不同,孔隙通道可达性系数随孔隙直径的增加而增加
阿尔茨海默病是因年老者髓海渐空,痰迷清窍,瘀阻脑络,痰瘀相互影响而发病。盐味咸,性阴,入肾,长期过量食用可使肾水亏、心气抑、脾胃虚、肝失疏泄,促使痰、瘀等病理产物生成。高盐饮食在阿尔茨海默病发生与演变过程中的影响可主要归结为伤脏、聚痰、瘀阻。在阿尔茨海默病防治过程中,应在补精益气、益肾健脑的基础上,有效控制食盐摄入,遵循“谨和五味”的饮食原则,调和人体阴阳,做到饮食有节、起居有常、顺应四时,才能有
关于计算机系统与网络中的资源管理问题的研究无处不在,其中计算集群的调度算法一直是研究的热点。目前大多数解决方案为启发式调度算法,但启发式算法无法全面地感知系统中调度作业之间的关联性,而深度强化学习可以通过数据自主学习这些潜在的关联性。本文使用了一种基于动作分支架构改进的深度强化学习调度算法,在Spark调度模型中取得了不错的效果。该算法通过将一个完整的调度过程分解为相对独立的分支动作,从而简化各个
目的 探讨晚期糖基化终末产物(advanced glycation end products,AGEs)与阿尔茨海默病(Alzheimer disease,AD)的关系。方法 选取2017年10月至2021年10月神经内科就诊的患者作为研究对象。根据有无AD,分为AD组和无AD组,其中AD组148例,无AD组264例。收集两组患者临床资料,采用单因素和Logistic回归分析AD相关危险因素。结果
采用基于密度函数理论(DFT)的全势线性缀加平面波(FPLAPW)的方法,结合JMat Pro软件,研究了3103铝合金PS版凝固过程中的析出相与基体间费米能级差异及其弹性性质等。结果表明:在3103铝基PS版中除α-Al之外,存在的析出相主要有α-Al(Fe,Si)、Al6Mn、Al18Cr2Mg3、Mg2Si、Al3Ti,Al3Zr、Al2Cu以及Mg Zn2相;其中Mg2Si电极电位与Al基
为了推进国家基层治理体系现代化建设,2021年国家发展改革委明确提出要引导是社区社会组织、社会工作服务机构、社区志愿者、驻地企业单位等共同参与社区治理。石家庄市积极响应国家号召,市委组织部联合市民政局,出台工作方案。笔者以石家庄市Y社区为例进行研究,采用文献分析、访谈和参与式观察的方法,综合运用社会支持理论、增能理论,对社区社会组织参与社区治理的动态过程进行研究,并借鉴我国经济发达地区的先进基层社
<正>中国品牌在亚洲的影响力越来越大打造具有全球竞争力的世界一流企业不仅要在技术硬科技上持续发力,还需要提升企业的品牌软实力,两种要素双轮驱动才能进一步提高企业的国际品牌认知度与竞争力。近年来,随着中国企业对品牌建设以及品牌全球化推广的进程不断加快,中国品牌在亚洲的影响力越来越大。“亚洲品牌500强”以企业的市场占有率、品牌忠诚度和亚洲领导力为标准评估企业品牌影响力。中国入选的品牌共计212个,占