状态抽象相关论文
强化学习定义了仅通过行动和观察学会做出良好决策的智能体所面临的问题。为了成为有效的问题解决者,此类智能体必须有效地利用有......
具有抽象机制的分层强化学习方法可以实现状态空间的降维,从而解决大规模系统中的“维数灾”问题。由于引入了状态抽象机制,分层强......
以动态环境下的机器人导航为例,研究了机器人在任务复杂、物体随机出现等情形下的潜在动作预测方案.采用层次结构描述机器人的任务......
符号执行技术以其良好的精确度控制和代码覆盖率被广泛应用于静态程序分析和高覆盖率测试用例自动生成。符号执行在分析程序时,以......
经典连续U-树算法使用分布检验来确定抽象状态的最佳分裂点,但选取合适的置信阈值非常困难.提出一种基于最优的最佳分裂点选取方法......