基于深度强化学习的多智能体搬运调度方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:zhongsichuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
木工家具制造业作为劳动力密集型制造产业及生活关联型民生产业,“个性化定制,柔性化生产”已成为其未来发展的方向。本文旨在以木工家具智能制造工厂内的木工物料自动化搬运系统为研究对象,构建多智能体系统模型,研究端到端的多智能体搬运调度策略。首先,本文对木工物料自动化搬运系统进行了抽象化建模。从木工物料自动化搬运任务的实际需求出发,构建了三个多智能体系统场景:合作导航、货物搬运、碰撞躲避。其次,针对深度强化学习在多智能体系统应用中存在的维度灾难问题,提出了一种基于策略注意力机制的深度强化学习算法(ATAC)。首先,通过样本池存储智能体与环境互动结果并提供训练样本。其次,以演员-评论家算法作为初始框架,通过集中学习、分散执行的方式训练出一个中心化的评论家,网络参数的更新采用双网络部分继承机制。然后,通过策略注意力机制选择性地关注重要信息。最后,在三个场景中设计了对比实验,验证了ATAC算法在解决多智能体系统搬运调度策略问题上的有效性。然后,针对深度强化学习在多智能体系统应用中探索度较低的问题,提出了一种基于自适应探索机制的多智能体深度强化学习算法(ADAC)。首先,改进了ATAC中的双网络部分继承机制,通过对神经网络稳定性的分析自适应地继承参数,达到加速训练的效果。其次,通过在ADAC目标函数中引入最大熵模型让策略更加随机化,增强了算法的探索能力。然后,信息熵的权重随着算法对动作空间探索度的升高而逐渐降低,使得算法最终的目标函数回归到累计奖励值的计算。最后,在三个场景中设计了对比实验,验证了ADAC算法在解决多智能体系统搬运调度策略问题上的有效性。
其他文献
2021年5月11日,备受瞩目的中国第七次人口普查(简称“七人普”)数据发布,引起学界和公众的高度关注。近一段时间,国内外学者、各部门和各级别的政府官员对于“七人普”的数据各种解读如火如荼。仅仅20天后,中共中央政治局5月31日召开会议,决定实施一对夫妻可以生育三个子女的政策,又引起了全民更加热烈的讨论。与中国前六次人口普查相比,“七人普”全面采用电子化方式进行数据采集,首次将身份证号纳入普查表内
期刊
立体几何问题主要考查空间中点、线、面之间的位置关系,对同学们的空间想象和抽象思维能力的要求较高.解答立体几何问题可以从不同角度出发,其中空间向量是求解此类问题的得力"工具".下面我们结合实例来谈一谈如何以空间向量为"工具",来求解立体几何问题.
期刊
吉林热电厂锅炉给水取自第二松花江,由于取水口上游工业废水和生活污水的排放,江水受到了严重的污染。仅在该厂江边泵站水入口处,就检测出32种有机物,水的化学耗氧量(CODMn)高时可达24.3mg/1。这些有害物质不仅使水处理系统的离子交换树脂受到污染、影响除盐水的水质和供水量,而且经锅
期刊
当人们沉醉于迪士尼的飞行影院时,一种更令人陶醉、更加刺激、更加震撼的立体影院观影场景诞生了,这就是首望体验科技文化有限公司(以下简称首望科技)历时六年开发出的胶囊型影院“720穿越飞船”。一次偶然的朋友聚会,听老朋友匡洪学谈起了这个新影视装备,匡总谈到首望科技已经获得北京市“专精特新”中小企业证书,我就想采访首望科技创始人吴晓斌先生。匡总说,我先带你去房山的北京高端制造业基地体验“720穿越
期刊
本文介绍D354—FC弱碱离子交换树脂用于水处理时的运行规律和工艺性能。根据本文提供的曲线和计算方法,可以求出给定条件下D354—FC树脂的工作交换容量和出水水质。用广泛现场调查所得数据与查图计算值相对照,吻合较好。
“双减”政策推行后,为保证教学质量,教师要探索教学模式和教学方式的转型:课前,要进一步完善集体备课制度;课中,要以目标为导向,灵活选择教学方法,提高课堂实效;课后,要加强教学反思和诊断,不断改进教学方法,提高教学水平。此外,要探索分层作业设计,提高作业的针对性,尽量采取多元化的作业评价方式;积极利用信息技术,为学生个性化学习创造条件,实现分类分层教学。
大数据技术拥有超强的数据处理能力,将其应用到交通领域,将有助于推动交通资源更加高效地配置,可以灵活应对各类事故性、突发性交通事件的发生。如今,我国交通领域的主要工作内容是推动交通运输需要和大数据技术的广泛融合。所以,应当制定相应的大数据交通融合标准,保障大数据技术在交通领域的稳定应用,从而提升交通数据源获取和配置质量,有效消除各类隐私风险以及信息安全风险,进而解决各种交通安全问题。
“双减”政策的颁布是一场基础教育大变革,对课堂主阵地的教学质量提出了更高的要求。教师作为课堂教学的主要实施者,在提升课堂教学的质量上起着关键性的作用。因此,“双减”政策对教师教学角色提出了新的要求,教师应成为学生学习动机的激发者、学生知识再发现的引路人、学生知识建构的资源供给者、学生全面发展的评价者和以学为本的反思者。
“双减”政策是新时代党中央站在实现中华民族伟大复兴战略高度作出的重要决策部署。“双减”政策对教师工作提出了新的挑战与要求,作为“双减”政策的直接实施者与落实者,教师应进一步提升课堂教学素养、作业设计素养、证据意识的评价素养、赋能学习者的数字信息素养与全方位的家校社协同育人素养。
张某,中共党员,某县公安局F派出所分管社区工作副所长。2017年,张某明知李某有贩毒行为并"以贩养吸",既未按照人民警察的职责对李某开展查禁行动,也未依法向公安机关报告。2019年,F派出所开展打击贩毒的专项行动,并通过早会、支委会等形式传达行动方案。张某作为分管社区工作的副所长,负责摸排人员、社区调查等工作,知道此次行动后,两次通过微信语音向李某透露公安机关缉毒行动的有关信息。2019年3
期刊