MDP模型相关论文
针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning, RL)方法为基础,提出了一种基于Q学习的多目标点迹-......
期刊
IEEE将软件测试定义为:使用人工或自动手段来运行或测定某个系统的过程,其目的在于检验它是否满足规定的需求或是弄清预期结果与实......
世界经济一体化加速了各国之前的贸易往来,港口作为多式联运中海陆联运的重要枢纽,也在推动区域发展过程中承担起更为重要的角色。......
随着多移动机器人系统的应用越来越向未知领域如医学领域、深海探测和航空航天领域等方向发展,在未知环境下解决避障路径规划问题......
本文在S、A(i)(i∈S)均匀可列集情形下,建立了折扣依赖于历史的矩最优模型。给出了折扣总报酬k阶矩在各类策略下的统一表达式;讨论......
随着互联网技术的迅速发展,互联网上的资源数量越来越多。搜索引擎的发展使得用户可以在庞大的信息资源中找到自己所需要的信息。......
对人脸检测与跟踪的研究现状进行了简要介绍,发现传统的MDP(Markov decision processes)跟踪算法需要手动初始化,这不利于实际场景......
移动agent是一类可以在网络站点之间连续迁移,并就地利用站点服务执行任务的程序。与基于RPC的分布式计算相比,移动agent计算具有......
半导体生产线结构复杂,具有典型的重入特点,加工产品种类多样,设备集成度高、造价昂贵。近年来半导体制造行业发展迅速,竞争激烈。......