【摘 要】
:
提出一种针对棋类智能体,基于显著图的解释方法,用来解释棋类智能体的决策依据.该解释方法将智能体面对的棋局状态分为落子区域和空白区域,从特征与最终决策的相关性和重要性两方面对棋局落子区域特征进行显著性分析,同时从博弈行为角度出发,分析棋局空白区域特征对于智能体决策的显著性,将两区域的特征显著性进行合并输出,从而较为全面地评估整个棋局特征的显著性.针对基于强化学习的围棋智能体和国际象棋智能体,使用该方法对智能体的决策进行解释性输出,实验结果表明:可以全面地解释智能体的决策依据,验证了该方法的有效性.
【机 构】
:
重庆理工大学两江人工智能学院,重庆 401135
论文部分内容阅读
提出一种针对棋类智能体,基于显著图的解释方法,用来解释棋类智能体的决策依据.该解释方法将智能体面对的棋局状态分为落子区域和空白区域,从特征与最终决策的相关性和重要性两方面对棋局落子区域特征进行显著性分析,同时从博弈行为角度出发,分析棋局空白区域特征对于智能体决策的显著性,将两区域的特征显著性进行合并输出,从而较为全面地评估整个棋局特征的显著性.针对基于强化学习的围棋智能体和国际象棋智能体,使用该方法对智能体的决策进行解释性输出,实验结果表明:可以全面地解释智能体的决策依据,验证了该方法的有效性.
其他文献
针对对置布置磁流变减振器的电动轮悬架,根据当前道路情况,取常见高速沥青路面的百公里加速、100 km/h匀速和郊区混凝土路面的60 km/h匀速3种路面激励,建立了1/4车辆模型,展开减振器的控制研究.设计了模糊及变论域模糊控制器对簧载质量速度及其与非簧载质量的相对速度、磁流变减振器的库伦阻尼力进行控制和仿真.结果表明:变论域模糊控制与模糊控制相比,百公里加速、100 km/h匀速和60 km/h匀速路面激励下车身加速度分别下降了7.0%、15.2%、23.7%,轮胎动载荷分别下降了28.3%、31.2%
与传统燃油汽车相比,电动汽车传动系统及其零部件通常在高频、强冲击、超长周次的动态载荷作用下运行,更易导致变速器齿轮发生接触疲劳破坏.为了准确计算电动汽车高速斜齿轮实际工况下的动态载荷,预测其使用寿命,以某定传动比变速器电动汽车为研究对象,建立车用永磁同步电机的矢量控制模型,基于瞬时道路工况对模型进行仿真,得到循环工况下驱动电机的动态转矩输出,并对实验结果进行验证;基于赫兹接触理论,以电机的动态转矩作为变速器驱动转矩,计算得到循环工况下高速斜齿轮接触疲劳危险位置的应力谱,并进行循环计数,获取了循环工况下高速
随着当前我国特色社会主义市场经济建设的快速发展与对大型高速公路交通工程的大规模投资,隧道建设工程数量也在不断扩大。伴随而来的是公路隧道火灾引发的各种事故和安全隐患。临界风速作为判断隧道火灾烟气逆流情况的重要指标,为火灾后续救援和人员逃生提供重要依据。因此,研究隧道火灾临界风速对当前隧道交通安全问题有着积极作用。论文基于传统数值模拟方法结合长短时记忆网络(Long Short-Term Memory
针对汽车弯道紧急制动避撞问题,提出了一种双层控制方法.上层控制器设计了弯道紧急制动策略,基于两车实际相对距离计算出增强型剩余碰撞时间模型,利用该模型确定制动阈值以及制动减速度;下层控制器为车辆逆动力学模型和车辆验证模型,通过PID控制器调节来提高验证模型的准确性,并基于模糊控制理论设计了横向稳定控制器;最后参照中国新车评价协会测试办法进行仿真验证,研究表明:自车在55 km/h时,制动结束后两车相对距离在1.5 m左右,带有稳定性控制车辆的质心侧偏角始终处于安全范围内,该策略能够实现弯道下车辆紧急制动.
在不同焊接电流条件下采用Zn-15%Al焊丝成功获得5052铝合金/Q235低碳钢电弧熔钎焊对接接头,采用扫描电镜(SEM)、剪切试验和X射线衍射仪(XRD)对接头组织和力学性能进行了研究.结果表明:焊接电流越大,焊缝填充金属的流动性越好,更易在母材上润湿铺展,形成良好的焊缝成形;随焊接电流80 A增加到100 A,金属间化合物(IMC)层的厚度由13.4μm逐渐增加到22.9μm,产生的界面IMC组织结构为Fe4 Al13、Fe2 Al5相;Zn元素固溶至IMC内部并形成的Fe2 Al5-Znx和Fe4
传统混合动力车用电机存在转矩密度小、效率低、散热不良等问题.为此,设计一款车用双定子单转子盘式永磁同步电机及其冷却散热结构.首先,设计双定子单转子盘式永磁同步电机的电磁结构及尺寸参数;基于Ansys Maxwell软件,建立其三维模型并进行瞬态电磁仿真,将仿真值与设计值进行对比分析;最后设计其冷却散热结构,进行热建模和温度场仿真分析.结果表明:额定工况运行时,额定转矩为358 N·m,额定转速为1600 r/min,额定输出功率为60 kW,满足电机电磁性能设计要求;电机的最高温度为133.8℃,不会造成
机器人跳跃运动是一种高效、重要的运动形式,不但能快速进行移动,还能通过一些特殊地形环境。本文对六足机器人跳跃运动控制进行研究,开发了一种新型的自适应控制器,并将其应用于六足机器人跳跃运动。本文主要研究工作如下:首先,在课题研究的背景下对跳跃机器人进行分类讨论,之后再对比分析国内外跳跃机器人研究现状以及发展趋势。最终确定六足机器人跳跃运动自适应控制的研究内容及研究方法。其次,根据跳跃蜘蛛的生理结构及
随着摩尔定律趋于失效,3 D封装和大功率器件的普及,具有较强散热能力的陶瓷基板、硅基板必将加速推广,由此引发更多的异质材料互连问题.综述了电子封装领域常用金属与金属,陶瓷与金属等异材互连研究进展,指出实现免热沉陶瓷与金属直接低温封接迫在眉睫,焊料添加更多的贵金属及稀有活性金属、焊料尺寸从传统块状或大尺寸颗粒向具有较强活性的纳米线或纳米颗粒转变,封装技术从传统的回流焊、压焊向飞秒激光、激光局部加热等大功率密度、局部热源及复合热源方向转变,封装可靠性从传统的热老化、热循环、热冲击向极端温度、极端温度梯度、快速
提出计算机博弈五大构成要素并基于分层递进思想设计了博弈智能体的分层结构,以久棋为案例,构建了久棋博弈智能体的知识库,重点提出了规则库、开局库的构造方法.针对藏族久棋规则的特殊性,面向久棋特有的3个阶段,基于量化思想,建立了分段评估体系.最后,以此方法开发久棋博弈程序,参加了全国计算机博弈大赛并获得好成绩,验证了方法的可行性和有效性.
在辅助加热惯性摩擦焊接技术的基础上,研究了Ni镀层对铝-钢异种金属惯性摩擦焊接头性能的影响.分别对接头微观形貌、界面化合物组成及分布形态、硬度以及接头抗拉强度进行了检测分析.试验结果表明:Ni镀层的加入会使接头界面变得平直,促使接头界面形成分布更均匀、更厚、塑韧性更好的Al-Ni金属间化合物层,提高接头的连接强度;同时Ni层的加入能够减小钢侧向铝侧传导的能量,减小铝侧的热影响区,阻隔Al、Fe元素的相互扩散,防止界面形成Al-Fe脆性金属间化合物.