多机器人对抗中的信息处理与决策方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiaohanhan52
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人的信息处理与决策方法是多机器人对抗环境中的关键核心问题。然而,现阶段对环境信息感知、机器人状态估计与决策等问题仍有很多研究工作有待深入。本文以ICRA DJI Robo Master人工智能挑战赛为背景,主要研究在多机对抗环境中的信息处理与决策问题,目的是实现机器人的目标检测、状态估计与自主决策。本文的主要研究结果总结如下:首先,分析视觉检测的任务和指标,给出视觉传感器的设计方案;考虑到移动端计算性能受限,提出了由两个检测网络构成的检测-跟踪框架;分别基于YOLOv3与Center Net设计了检测网络与跟踪网络;基于仿真数据构建了数据集并对网络进行了训练,在仿真数据与真实数据集中进行了测试,结果表明基于YOLOv3的目标检测与跟踪网络在实际应用中实现了高精度高频率的检测,符合比赛需求。其次,针对扩展卡尔曼滤波算法中存在的高斯噪声假设、噪声变化时不稳定等缺陷,提出了一种深度自适应扩展卡尔曼滤波算法,设计了噪声估计网络模块与扩展卡尔曼滤波深度嵌合结构;通过几个非线性系统仿真实验,说明了所提出的深度自适应扩展卡尔曼滤波较传统滤波方法具有更好的估计性能与稳定性。再次,分析策略仿真环境对仿真频率、射击真实度与规划真实度等方面的要求,设计了多机器人对抗仿真环境平台整体架构,包括场地环境、路径规划、机器人系统与可视化四部分;为尽量接近真实并实现高仿真频率的规划,提出了基于优化的三次样条插值与Social GAN的两种规划方法;测试表明所设计开发的策略仿真平台能够真实和高效的完成比赛仿真,为强化学习策略算法设计和训练提供了有力支撑。最后,考虑到样本效率、可扩展性和泛化能力的要求,将决策任务合理分解为直接与间接两种任务类型;提出了一种基于分层强化学习的多机对抗决策方法,并采用了MADDPG算法对攻击模块进行了训练;实验结果表明所提出的决策方法训练时间短,机器人能有效学习任务分解后的行为,提升决策算法的可行性与鲁棒性。
其他文献
不平衡学习是机器学习的重要研究内容之一。不平衡数据在类别分布上呈倾斜分布,通常情况下少数类具有更高的价值,但在多数类的影响下,传统的机器学习算法对少数类的识别率较
眼睛不仅是观察世界的重要窗口,也肩负着反映身体表征特性的重要职责。眼睛底部的视网膜血管特征是多种疾病判断的重要依据。然而,视网膜血管的结构复杂多样,常常导致难于观
空间技术的发展极为迅速,在现代化战争中空间平台的作用愈来愈显著。各国都在大力地研发空间技术和空间武器,以提高本国在信息化战争中的实力。本课题以空间攻防中采用反卫星
网络技术与计算机技术的快速发展,便捷了地理空间数据获取与分发,使得地理空间数据广泛应用于卫星导航、城乡规划与建设、防震减灾系统等国民经济与国防建设的众多领域。地理
高通量基因微阵列技术的出现,产生了大量的基因表达数据。这些数据在追踪生物过程,基因规则发现以及病理分析中有着至关重要的作用。通常,研究人员通过聚类来挖掘相关的基因
机车电源是电力机车上重要的设备,其性能直接影响电气化铁道系统能否正常运行,研究具有数字化、智能化特色的先进的机车电源试验平台对提高机车电源可靠性、进而对电气化铁道
近年来,将随机系统的相关理论应用于生物系统已成为许多学者的研究重点。在现实生活中,大多数生物系统会受到随机因素的影响,从而发生行为上的改变。因此,研究随机广义生物经
多视图多标记学习作为机器学习中最具潜力的技术之一,近年来备受关注且已被广泛应用至异质多媒体数据分析和生物信息学等诸多领域中。该技术旨在从不同的角度出发,对有多个特
随着遥感技术的发展,遥感图像的光谱分辨率、时间分辨率和空间分辨率都在逐步提高,人们可以从遥感图像中获得更多的有用信息。目前,遥感技术已经广泛应用于军事、环境监测、
现役四角切圆锅炉普遍存在锅炉再热汽温偏差大的问题,再热蒸汽温度偏离设计值会影响设备运行的经济性,严重时会危及机组安全。本文所研究的660MW超超临界机组锅炉为四角切圆π型炉,高温再热器出口汽温左右侧偏差达16-20℃,低温再热器左侧温升较右侧高20℃左右,处于烟气上游的高温再热器左侧温升较右侧低10℃左右。由于烟气顺时针旋转进入水平烟道,左侧烟气速度快,对流换热更强,因此,左侧温升高,低温再热器的