强化函数相关论文
居民用电行为监测是智能电网建设的一项重要内容,也是实现电能合理分配的重要依据。用电负荷分类是居民用电行为监测的一个重要支......
Q 学习算法是求解信息不完全马尔可夫决策问题的一种强化学习方法.Q 学习中强化信号的设计是影响学习效果的重要因素.本文提出一种......
为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统-Keepaway平台总是以失败告终的特点,受与之有相同特点的......
强化函数的设计是构建多智能体学习系统的一个难点。提出了一种基于知识的强化函数设计方法,根据实际应用的特点,将经验信息和先验知......
期刊
将强化学习中的Q学习算法与Agent技术相结合,构成Agent控制器对单路口的信号灯进行控制。介绍了将经验知识与Q学习算法相结合实现......
随着现代科学技术的飞速发展,机器人的开发与应用范围的不断扩大。对于不同的工作任务和不同的工作环境,尤其是一些大型复杂的工作......
<正> 1.引言本文基于内时理论,新构造了一种用于具有明显屈服特性材料的强化函数.由此确定的内时弹塑性本构方程可自动跨越塑性流......